三维传感技术从感知方式上分类可以分为接触式测量和非接触式测量。
接触式测量主要依靠标定 的被动机械臂直接接触物体表面,逐点对物体轮廓数据进行釆集,对其形态信息进行三维测量。这种方法的优点是测量精度高,可达到微米级别。但是其缺点也包括了测量效率低,不适合形态复杂物体测量,对测量环境要求较高等。
非接触式测量主要指依靠光、 声、电磁学等方式接触物体表面以获取物体三维信息的方法。而其中基于光学的三维测量技术是目前最典型也是应用最广泛的三维传感技术。如图 1所示, 典型的光学三维传感技术主要包括光度立体视觉、 双 (多) 目立体视觉、飞行时间法、激光线扫法、散焦恢复形状法、结构光投影法等,而结构光投影又包括条纹投影与散斑投影法等。
1、光度立体视觉法
光度立体视觉技术最早由 Woodham提出,其假设了一个已知的重构函数,即理想的朗伯体反射模型。采用一个相机和几个发光强度相同的光源,保持相机和拍摄物体静止,通过改变光源方向,同时拍摄 物体在不同光源照射条件下的一组图像,然后根据这 些图像计算出物体的表面法向,再由法向求解出物体 表面三维形状,图 2 给出了光度立体法对斯坦福兔的 三维测量结果。随后一系列方法被提出以解决光度立体法模型、对高光物体测量及标定等问题。光度立体法的设备较简单,但对环境要求严格,并需要待 测物表面为严格平滑的漫反射朗伯体,对于具有陡变或者反射特性较为复杂的物体难以适用。
图 2 光度立体法对斯坦福兔子的测量结果。(a) 斯坦福兔子模型; (b) 法线图; (c) 重建图
2、(被动) 立体视觉法
立体视觉是一种模拟人类视觉原理的被动深度感知方法。测量系统基于三角测距原理,用两个或多个相机从不同角度获取同一场景的多幅图像,通过对同一物点在各幅图像上检测和匹配,根据立体视差进行测距,得到物体该点的深度信息。其原理如图 3 所示。立体视觉测量系统硬件结构简单,易实现。其主要难点在于立体匹配,实际应用中由于遮挡或阴影的影响,可能会产生视觉信息不足的问题,导致误匹配。另外,对于无明显表面特征的物体,也难以从多个视角中找到对应点,因而无法进行准确的三维重建。但值得提及的是,立体视觉法的基本三维重建原理和后面所介绍的结构光投影法是一致的。
图 3 立体视觉法示意图
3、飞行时间法 (ToF)ToF 技术通过记录光束传播时间来计算被测物体表面的深度距离。其原理如图 4所示,系统发射装置发射脉冲信号,经被测物体反射后被探测器接收,通过光信号从发出到接收的时间与光速便可以计算出深度值。该方法可避免阴影和遮挡带来的问题,但由于设备装置的限制,测量精度一般在毫米级。若想达到更高的精度,就需要更加复杂、昂贵的设备。虽然许多学者尝试将飞行时间法与多视几何相结合来提高测量空间分辨率与测量精度,但与高精度测量方法相比,飞行时间法还存在一定的差距。
图 4 飞行时间法原理图
4、激光线扫法
激光线扫法的原理如图 5 所示,它是一种最简单的结构光三维测量技术。该技术利用线激光器投射一维线激光到物体表面,图像采集装置采集到物体表面变形的线激光,然后根据三角测量原理得到物体表面相应位置的三维信息。线激光扫描方法的优点是 其数据采集不依赖外部光照环境,对目标场景要求低,操作简单直观,自动化程度高。但由于激光扫描仪本身技术的限制,它也存在以下不足:扫描速度较慢,激光扫描仪造价高;其最高精度和最大扫描距离是固定的,无法像摄影测量那样通过方案设计 来得到提高;无法获取高质量纹理数据等。宽泛意义上来说,激光线扫法其实是结构光投影法的一种极端特例。但由于投影图案就是一条直线,所以测量效率要比全场结构光技术低得多。
图 5 激光线扫法原理图
5、散焦恢复形状法
散焦恢复形状法 (Shape-from-defocus, SfD) 的原理如图 6 所示,散焦恢复形状是通过处于不同深度方向物体在图像中离焦的程度来恢复物体的深度值,测量过程中需要移动被测物或是相机,拍摄至少两张不同聚焦程度的图像。1995年,哥伦比亚大学的Nayer首次实现基于离焦投影恢复的三维面型测量法,其向被测物体投射设计好的图案,经被测物体反射后,通过分束棱镜将光线分离,由两个相机在同一个方向分别采集,由于两幅图像具有不同的离焦信息,因此可以计算出相机图像中每个像素的深度值, 如图 7 所示。测量过程中,投影与采集方向几乎一 致,因此测量时很少会受到遮挡与阴影的影响,并且计算过程较为简单,在不依赖于高性能硬件条件下便可以实现实时动态三维面形测量。1998 年,Nayer 等 人在不使用主动光源的情况下,实现了具有纹理表面物体的三维测量。然而,该方法的深度测量精度还有待进一步提升。
图 6 散焦恢复形状法测量原理图
图 7 散焦恢复形状法测量结果
6、结构光投影法
结构光投影法是一种非常流行的非接触式三维形貌测量技术,其具有硬件配置简单、测量精度高、 点密度高、速度快、成本低等优点,已在工业和科学研究中得到广泛应用。从本质上讲,结构光投影法可以看作是立体视觉法的一种改进形式,其通过将立体视觉中一个摄像机替换成光源发生器 (如投影仪) 而 实现,原理如图 8 所示。光源向被测物体投影按一定规则和模式编码的图像,编码图案受到物体表面形状的调制而产生形变。带有形变的结构光被另外位置的相机拍摄到,通过相机与投影光源之间的位置关系和结构光形变的程度可以确定出物体的三维形貌。
相比于立体视觉法,其最大优点在于投影仪将结构光图像投射到物体上,由于物体表面被编码图案所覆盖,可以很容易地克服立体视觉中的立体匹配问题。此外求解物体初相位时是点对点的运算,即在原理上某点的相位值不受相邻点光强值的影响,从而避免了物面反光率不均匀或观察视角的偏差引起的误差,测量精度可以达到几十分之一到几百分之一个等效波 长。有关结构光投影法的基本原理可见 Geng 等的结构光教学论文。
图 8 结构光投影法示意图
在过去的几十年中,基于结构光投影法的三维形状测量技术在计算机视觉和光学测量领域得到了迅速发展。在计算机视觉领域中,结构光投影技术通常被称为 3D 扫描,且所使用的结构光投影图案主要集中于基于离散强度方案。它们可进一步分为空间编 码 (单次拍摄) 和时间编码 (多次拍摄) 的方案。空间 编码方法有 De Bruijn编码,非正规码和M-array 码。这些方法的关键思想是保证局部编码在全局图像中的唯一性。时间编码方法是将有一定编码的图案连续投影到物体表面上,方法包括时间二进制码、时间 n 元码和格雷码。此外,还有学者提出使用红、绿、蓝三通道的彩色图案或彩色多路复用结构光投影法来提高编码效率并减少三维重建 所需的结构光图案。关于这些编码方案的基本原理和实际性能的更多细节,可见 Salvi 等人的综述文章。由于数字光学投影仪的快速发展,使得所投影的面结构光可以通过计算机编程更为灵活地进行选择, 并最大限度地提高测量精度和速度,这些优点使结构光投影技术成为最具潜力的三维面形测量技术之一。
6.1、条纹投影轮廓术
在光学测量领域,最具代表性的结构光投影技术被称为条纹投影轮廓术 (Fringe Projection Profilometry,FPP)。FPP 具有结构简单、精度高、速度快、成本低、 易实现等优点,其在工业和科学研究领域都有较广泛的应用。当代条纹投影轮廓术主要采用数字光栅投影技术,该技术通过利用数字设备取代机械装置生成与投影面结构光光栅,使得编码过程更加灵活准确。此外由于现代电子设备的高速发展,数字投影设备和采集设备的速度越来越快,结构光条纹投影技术的应用可完全满足三维面形的高速实时测量 要求。基于条纹投影轮廓术的三维测量系统和结构光投影法的硬件系统相一致,一般由一个投影仪和一个或多个相机组成,如图 8 所示。在测量过程中,投影仪将光栅条纹投向物体,条纹图案经物体调制后变形,再由相机采集。从采集到的条纹图中可获取物体 相位信息,相位图中可以找出相机在投影仪中的对应点,然后根据三角关系可求出物体的深度信息。在此过程中存在三个重要步骤:相位测量,相位展开,相位-深度映射。
FPP 中两种主要的相位测量技术是 (时域) 相移轮廓术 (Phase Shifting Profilometry, PSP)和(空域) 傅里叶变换轮廓术 (Fourier Transform Profilometry, FTP)。FTP 是一种基于空间滤波的单帧光栅投影法,其最初于1982 年被 Takeda 等首先提出,之后Su,Zhang 等针对此方法开展了系统深入的研究工 作。此外,加窗傅里叶变换 (Windowed Fourier Transform, WFT)和小波变换 (Wavelet Transform, WT)也可用于单帧条纹图的相位解调。有关傅里叶变换轮廓术的更多详细的技术细节及其在动态三维测量方面的应用,可见参考文献。不同于 FTP,PSP 需要至少三幅相移条纹图案以实现逐像素的高精度相位测量。PSP 源于激光干涉技术,Srinivasan 等首先将相移干涉技术引入三维形貌测量领域。
相比于 FTP,PSP 具有更高的空间分辨率和相位测量精度, 并对环境光和物体表面反射率的变化更加鲁棒。由于其多帧测量特性,当测量动态场景时,尤其当帧间间隔内的物体运动不可忽略时将导致相位误差。严格来说,运动引起的相位误差是 PSP 固有且不可避免的问题。但近年来,随着高帧率图像传感器、高性能处理器和高速数字投影技术的发展,PSP 已逐渐应用于动态场景的高速实时三维测量。笔者所在课题组自 2011 年起针对相移轮廓术及其快速三维测量应用方面也开展了系统性的研究工作,有关更多 PSP 的 技术细节及其相位误差分析的内容可见参考文献。
无论是 PSP 和 FTP,与目标高度所对应的相位分布都由反正切函数得出,其范围限制在-π 和 π 之间, 这样的相位称为截断相位或包裹相位。为了建立相机和投影仪之间一对一的像素对应关系,并正确重建三维形貌,需对相位进行展开/相位去包裹。
常见的相位展开法分为空间相位展开和时间相位展开两大类。
空间相位展开通常只需一幅单独的相位图,依据像素邻域内的相位值实现相位展开。代表性的空间相位展开法主要包括可靠度引导的相位展开法、剪枝法、多网格法、最小LP范数法、掩膜切割法、p最小二乘相位展开法等。但对于孤立物体和不连续表面的相位分布,利用空间相位展开法理论上是无法无歧义地实现可靠的相位展开的,如图 9 所示。
图 9 孤立物体和不连续表面的包裹相位存在条纹级次歧义
时间相位展开方法通过采用多个包裹相位分布或添加额外的黑白编码图案来提供关于条纹级次的额外信息,以解决相位歧义问题。与空间相位展开相比,时间相位展开中的每个像素的条纹级次都是独立计算,无需参考邻近像素,因此可以展开任意复杂形状表面的包裹相位分布。其中常用的算法包括格雷编码法与多频时间相位展开法。有关于时域相位展开的基本原理和各类算法的技术对比可见参考文献。
通过解算出的物体的绝对相位信息,就可以找出相机所拍摄图像在投影仪图像中的对应点,然后根据三角关系可求出物体的深度信息。这种三角测量与立体视觉的三维重建原理是立体视觉与所有结构光 三维测量技术的基础,在第三章进行了详细讨论。
6.2、散斑结构光投影法
与条纹投影轮廓术类似,散斑结构光投影法也属于结构光投影技术。其三维重建的基本流程为:
首先,对物体投射随机散斑图案,利用提前标定好的双目相机同时拍摄物体获取左右原始散斑图;其次,对原始散斑图像进行极线校正和散斑区域提取,在此基础上利用数字散斑相关方法搜索整像素对应点并根 据视差约束剔除误匹配;然后通过合适的亚像素搜索方法得到准确的亚像素对应点;最后,利用三角测量原理重建出物体的三维形貌。
数字散斑相关测量技术具有系统简单,单帧重建,测量范围大等诸多优点。散斑结构光投影法是文中所要讨论的主要内容。文章的后续章节将对其基本原理、关键技术、典型应用等进行了详细分析与讨论,因此这里只做简单介绍。
内容节选自《红外与激光工程》第 49 卷第 3 期。如有侵权,请通知删除。
作者:左超1,2,张晓磊3,胡岩1,2,3,尹维1,2,3,沈德同3,钟锦鑫1,2,3,郑晶3,陈钱2*
(1. 南京理工大学 电子工程与光电技术学院 智能计算成像实验室 (SCILab),江苏 南京 210094;
2. 南京理工大学 江苏省光谱成像与智能感知重点实验室,江苏 南京 210094;3. 南京锆石光电科技有限公司,江苏 南京 210094)