【AR实验室】ARToolKit之概述篇

  • 时间:
  • 浏览:2

0x00 - 前言


我从去年就开始了了对AR(Augmented Reality)技术比较关注,就让 去年AR行业经常占据 偶尔发声的情形,丝毫没办法 其"异姓同名"的兄弟VR(Virtual Reality)火爆。至于MR(Mixed Reality)更像是Google Glass事情就让 对AR的洗白。就让 今年AR行业出了件大事,没错,别左右看到,说的就让 不是你 —— Pokemon GO。暂且不讨论这款游戏不是是AR游戏,毕竟争议挺大,就让 这款游戏我我实在是让AR火了一把。AR应用开发貌似不是了燎原之势。

0x01 - AR技术定义


目前对AR技术的常见理解就让 CV(Computer Vision)+CG(Computer Graphic)。CV的法律措施全都全都,简单些比如FREAK+ICP(ARToolKit中的NFT),冗杂些就让 SLAM(Magic Leap)。CG就没哪些地方好说的,利用CV算法获取到的图形相关信息(比如CG中的模型矩阵、视图矩阵、投影矩阵)进行绘制。从本身 点上来说Pokemon GO我我实在能够算作AR游戏,毕竟人家就让 基于LBS的。

知乎上一个话题 - 我要给大伙儿说下AR的昨天今天明天可以 够吗?欢迎并肩讨论 关于未来的AR价值形式?顶端提到了AR本身被广泛接受的定义:

1. 本身是Paul Milgram和Fumio Kishino于1994年定义的“现实-虚拟连续体”。大伙儿描述了从真实环境到虚拟环境的连续体。如图1-2所示,真实场景和虚拟场景分布在两端,在这两者之间接近真实环境的是增强现实,接近虚拟场景的是增强虚拟(扩增虚境),而占据 顶端的每种叫做混合实境。

2. 另外本身定义是1997年北卡大学的Ronald Azuma提出的增强现实的定义。他认为增强现实技术应具三个小具体价值形式:三维注册、虚实融合以及实时交互。

作者:AR学院归海

链接:https://www.zhihu.com/question/33214635/answer/520058935

来源:知乎

著作权归作者所有,转载请联系作者获得授权。

肯能从本身个定义来说,Pokemon GO也是可以 够算本身简单形式的AR游戏,大约 给人在感官上的体验是符合AR的。其我实在我知道全都全都人认为下面另一个才叫AR……就让 不是大伙儿还是要有信心的嘛!

这里我表达一下每每各自 对AR的看法:

不管是vision based还是LBS,AR在技术上的目标我我实在就让 建立一个和现实场景1:1的虚拟世界。从CG的深层,AR最关键的技术点是建立一个相机坐标系,能够获取到现实场景中相应的模型信息(网格、位姿、材质等等)。没办法 vision based的法律措施目前可以 够做到对于肯能注册过的识别对象,是可以 够获取到它在相机坐标系中的位姿信息。而LBS的法律措施更符合一般CG开发的流程,首先利用GPS建立一个世界坐标系,就可以 够获取到每个物体在世界坐标系的位置(包括相机),另一个你就可以 够将哪些地方地方物体转化到相机坐标系中,思路差不要 是另一个,就让 精度上占据 一定大问题。目前给AR下一个精准的定义还太早,我认为用户感官上我实在是虚实融合就可以 够不是AR。

0x02 - AR技术现状


我实在顶端提到了全都全都次Pokemon GO,就让 LBS的AR系统暂且是我要研究的重点,毕竟从目前来看vision based的AR系统才是主流。就让 局限于每每各自 的见识,只使用过Vuforia、EasyAR、ARToolKit。大伙儿有兴趣话语,可以 够看一下知乎上的讨论 - 哪些地方地方比较优秀的AR开源项目,肯能SDK?

Vuforia没办法 说,商业SDK,支持的价值形式也比较多,好像可以 够支持3D Object Tracking,具体支持到哪些地方程度,还没办法 尝试,大伙儿感兴趣可以 够登录Vuforia官网。EasyAR是国内的一款SDK,AR识别性能还是要赞一个,大伙儿可以 够去看EasyAR官网视频,还是很真实地反映了其性能(不像Magic Leap就让 那个鲸鱼的视频),每每各自 还是很看好的,比起Vuforia最大优势是免费使用时能够水印(^_^;)。而ARToolKit相对上述一个SDK在识别性能和价值形式上表现的不是很突出,就让 ARToolKit胜在开源,肯能你可以 够做全都AR业务扩展,而Vuforia和EasyAR能够满足你,ARToolKit是一个很好的选则 。就让 AR其中一个趋势就让 集成到现有App中,没办法 使用Vuforia和EasyAR的代价就比较大了。另外作为一个学生,抱着研究学习的心态,ARToolKit就再大约 不过了。

所就让 期我还是专注于ARToolKit的研究上,听说今年秋天ARToolKit6将发布,还是很期待的,ARToolKit官网链接请戳。

0x03 - ARToolKit概述


ARToolKit系统核心思路是另一个的:

下面以NFT(自然图片追踪,Natural Feature Tracking)为例,简述AR实现流程

1. 通过相机校准(标定),获取到肯能相机制造工艺偏差而造成的畸变参数,也就让 相机内参(intrinsic matrix),来复原相机模型的3D空间到2D空间的一一对应关系。这对顶端的价值形式提取步骤有很大作用。

2. 根据相机本身的硬件参数,大伙儿可以 够计算出相应的投影矩阵(Projection Matrix)。

3. 对待识别的自然图片(也就让 任意的一张二维图片)进行价值形式提取,获取到一组价值形式点{P1}。

4. 实时对相机获取到的图像进行价值形式提取,也是一组价值形式点{P2}。

5. 使用ICP(Iterative Closest Point)算法来迭代求解这两组价值形式点的RT矩阵(Rotation&Translation),即Pose矩阵,也就让 图形学中常说的模型视图矩阵(Model View Matrix)。

6. 有了MVP矩阵(Model View Projection),就可以 够进行图形绘制了。

0x04 - ARToolKit支持价值形式


目前来说,ARToolKit支持自然图片/Marker/2D BarCode的识别。

  • 自然图片除理

本身 应用比较广泛,对用户的限制也会小全都全都。不过最好使用全都价值形式比较明显的图像,效果会更好。

  • Marker/MultiMarker

这是本身经过特殊除理的图像,可以 够在边缘包裹单单两层,最外侧是包裹单单了白色/浅色边缘,内侧是包裹单单了黑色边缘,大伙儿猜能够猜出来另一个做主就让 提高识别度,并肩也方便计算Pose(肯能够能够直接提取边缘来计算Pose)。如下图:

  • 2D BarCode(二维码)

本身 没哪些地方好说的,最常见的。

另外ARToolKit目前支持的渲染引擎是OSG(OpenSceneGraph),不过版本比较低。当然,你能够能够使用OpenGL ES进行绘制。毕竟大伙儿只可以 够获取到了MVP矩阵,理论上绘制每种是可以 够删剪分开的。

0x05 - 参考资料


  • 我要给大伙儿说下AR的昨天今天明天可以 够吗?欢迎并肩讨论 关于未来的AR价值形式?
  • 哪些地方地方比较优秀的AR开源项目,肯能SDK?