寻找恰当地方法表示任意物体的形状,是图像识别中的关键问题之一,二者之间有着密切的联系。对于表示方法的基本要求是关于平移、旋转、缩放具有不变性。
该问题有以下几个难点:
- 描述子需要有足够强的能力以区分不同目标物体,但又能合并对于同一个物体的三类变换
- 描述子应能描述任意形状,以便被应用于通用视觉任务
- 应对输入数据中的噪声具有鲁棒性
常用方法如下:
1. 简单滑窗块匹配 对光照变化敏感,对变换不具有不变性。可改进为只使用边缘匹配。
2. 骨骼形状 通过反复细化原始形状的连通区域,直到只剩下单个像素。
该方法主要利用了目标的拓扑形状,在手写文字识别领域中较为合适。该方法满足不变性,但有时仅凭借拓扑信息过少,需要添加一些结构约束。
3. 不变矩特征 包括重心、转动惯量、高阶矩等。描述简洁,但其不变性需要以精确确定重心为前提,依赖于目标形状分割的精度。
4. 对数-极坐标映射 记
z=x+yj
w=ln(|z<