ARTAG论文笔记

最新推荐文章于 2024-07-13 14:02:27 发布

soul-chang

最新推荐文章于 2024-07-13 14:02:27 发布

阅读量2.5k

点赞数 2

本文链接：https://blog.csdn.net/weixin_41764123/article/details/99287558

版权

ARTag

ARTag是一个具有2002个标记的平面标记系统，在检测与识别方面改进了ARToolkit的性能，拥有一个更大的库，并且不需要使用图案文件。ARTookit的最大弊病在于它会错误识别出不存在的标记，并且容易混淆任意的两个标记。ARTag中保留了使用带有内部图案的方形边框的范例，但内部图案的处理被数字方法所取代。
分析ARToolkit的特点，可以看出对其功能的贡献最大的是边界仅使用黑色和白色，在标记中仅使用两个极端的反射率可以避免许多图像捕获问题和灰度非线性问题。这个二元决策在ARTag中扩展，从仅定义边界到定义内部模式。
ARToolkit方形边框对于AR非常有用，因为它有四个突出的角落。四个点允许完全提取相关标记到相机姿势的6自由度（DOF）势（假设相机焦距已知）。 ARTag旨在包含ARToolkit和Datamatrix的成功元素，并充分利用两者，并为AR制作一个最小但功能强大的系统。
ARTag的主要特征是使用了两个极性的方形边框（白色为黑色或黑色为白色）和6 x 6方形网格划分内部。整个标记为10 x 10单位，边界厚度为2个单位，内部留下36个单元格以携带信息。每个单元只有黑色或白色，并带有一位数字数据。因此，一旦确定了边界，就可以从标记的相机图像中提取36位字。

一、四边形检测

图像中存在许多四边形边框，有的可能属于标记的外边界。在ARTag系统中，用基于边缘的方法来检测到这些边框，边缘像素被阈值化并链接成段，这些段又被分组为“四边形”。四边形的四个角用于创建单应映射以对标记内部进行采样。图3显示了一幅图像，及其提取的线段，四边形和内部可能包含ARTag标记码的四边形
在这里插入图片描述
基于边缘的方法比其他系统（如ARToolkit）的灰度区域阈值处理方法提供了一些性能改进。在ARToolkit中，找到低于指定阈值的连接像素组，并且具有四边形边界的那些用作潜在标记。具有灰度强度阈值的空间导数而不是简单的灰度强度阈值允许在较少受控的照明条件下找到标记。实际上，一个标记边缘的“白色”程度可能比另一侧的“黑色”程度更暗，并且仍然可以检测到标记。
ARTag基于边框方法的另一个好处是在存在遮挡的情况下仍能检测标记轮廓的能力。在图3中，两个标记（ID 103,104）具有侧面断裂或角落缺失但仍然通过几乎相遇的线段的启发式检测。图3（右下）显示了用虚线绘制的遮挡四边形，表明它们不是从四个分段完整的分组中获得的。
为了进一步降低假阴性率（false negtive rate），ARTag在三个等级上搜索四边形。线段提取和分组为四边形工作使用的原始图像的尺寸；而重采样工作使用的是宽度和高度的一半的图像，以及在四分之一尺寸的重新采样版本上完成的。这允许检测可能模糊并且不具有高于阈值的空间导数的边界。

二、数字处理

一旦定位了四边形边界轮廓，就用6×6网格对内部区域进行采样，并为其分配数字符号“0”或“1”。应用的阈值来自四边形周围的强度。用于验证和识别标记的所有后续处理以数字方式执行。从2D 6×6数字符号阵列获得四个36位二进制序列，每个二进制序列都代表标记的一种旋转方式，在解码过程中只验证四个序列中的一个。标记中编码的36位二进制序列使用数字方法封装10位ID。额外的26位提供冗余以减少错误检测和识别的可能性，并提供四种可能旋转的唯一性。循环冗余校验（CRC）和前向纠错是用于识别36位代码是否是ARTag标记集的一部分并提取其ID的数字方法。
这些方法使用称为GF-2或Modulo-2数学的数字代数，并涉及使用逻辑XOR，卷积和反卷积运算符的加法概念，以及生成在该基数2数系统中作为素数的多项式。除了描述实际上用一个操作者操纵短二进制符号序列时，超出本文的范围解释，ARTag标记解码中最重要的一个是反卷积/除法运算符。读者可以参考[10]，数字通信和存储文本以及标准文档以获取更多信息。在解码ARTag标记的两个阶段中，数字代码被特别选择的二进制多项式除，其中使用了被除数和余数。
该系统可以抽象地描述为通信系统，其中尝试通过ARTag视觉软件接收的图像捕获介质发送10位ID。从ID创建标记模式是编码阶段，并且从提取的36位代码中识别ID是解码阶段。
在创建要在环境中安装的2D图案时，编码有三个主要阶段，当查找ARTag标记时，它们的操作反向执行。数字编码操作如下面的图4所示。
标记图案的打印，标记的反射，照明，场景中的其他对象，包括噪声的照相机的光捕获和数字图像形成以及标记的透视姿势都构成“通信介质”。在从图像中提取6×6网格的二进制符号之后，执行图5中概述的数字解码步骤，并且确定ARTag标记存在与否的判定，并且如果存在则报告ID。
XOR操作用于对代码进行一些加扰，因为期望用户使用较低的数字0,1,2，…等，并使ID为0可用。 CRC-16多项式（在数据存储和通信领域中也称为CRC-CCITT） $x^{16}+ x^{12} + x^5 + 1$ 是通过将XOR’d ID与二进制字符串10001000000100001卷积来应用的解码器中的去卷积类似于产生被除数和余数的除法运算。余数必须为0，否则代码被认为不是来自ARTag标记，只有 $\frac{1}{2^{16}}$

最低0.47元/天解锁文章