图像表示与描述是图像识别和理解的重要组成部分。图像表示分成边界表示(如链码、边界分段等)和区域表示(如四叉树、骨架等)两大类。边界表示关心的是图像中区域的形状特征,区域则表示倾向于反映区域的灰度、颜色、纹理等特征的特点。
11.1 图像表示
11.1.1 链码
边界的方向链码表示既便于有关形状特征的提取,又节省存储空间。从链码可以提取一系列的几何形状特征,如周长、面积某方向的宽度、矩、形心、两点之间的距离等。在数字图像中,边界或曲线是由一系列离散的像素点组成的,其最简单的表示方法是由美国学者Freeman提出的链码方法。链码实质上是一串指向符的序列,有4向链码、8向链码等。链码是一种边界的编码表示法,用边界的方向作为编码依据。为简化边界的描述,一般描述的是边界点集。
起始点归一化链码用于解决起始点问题和最小自然数,旋转归一化链码解决旋转问题和差分计算。链码可以简化表示、节约存储量;计算简便、表达直观;可了解线段的弯曲度。
曲线的链码是:
曲线的链码是:
11.1.2 边界分段
将边界分成若干段,然后分别对每一段进行表示,从而降低了边界的复杂度,并简化表示过程,尤其是当边界具有多个凹点的时候这种方法更为有效。
边界分段的基本步骤如下:
构造边界的凸包(包含边界的最小凸集);
跟踪区域凸包的边界,记录凸包边界进出区域的转变点即可实现对边界的分割。
11.1.3 多边形近似
数字边界叶可以用多边形近似来逼近。由于多边形的边用线性关系来表示,所以关于多边形的计算比较简单,有利于得到一个区域的近似值。
多边形近似比链码、边界分段更具有抗噪声干扰的能力。对封闭曲线而言,当多边形的线段数与边界上点数相等时,多边形可以完全准确的表达边界。但在实际应用中,多边形近似的目的是用最少的线段来表示边界,并且能够表达原边界的本质形状。
最小周长多边形法以周长最小的多边形来近似表示边界。它将边界看成是介于多变形内外界限之间的有弹性的线。当它在内外迹象的限制之下收缩紧绷的时候,就可以得到最小周长边界。
Sklanskey等人给出了求最小周长边界的一种算法,该算法使用于无自交情况的多边形。该算法在获取边界之后,先查找边界的拐角点,并且标记该拐角点是凸点还是凹点。然后将所有的凸拐点连接起来作为初始的最小周长多边形P0。接着把所有在多边形P0之外的凹拐点移除。再将剩余的凹拐点和所有凸拐点一次连接,形成新的多边形P1,然后移除所有原为凸点而在新多边形中变成凹点的拐点。再用剩余的点连接形成新多边形,再次移除。如此循环,直至新形成的多边形中没有凹点。
11.1.4 标记图
标记是边界的一维表达,基本思想是将原始的二维边界用一个一维函数来表示,以达到降低表达难度的效果。
11.2 边界描述
11.2.1 边界长度
边界长度是边界所包围的区域的轮廓的周长。4-连通边界的长度为边界上像素点个数,8-连通边界的长度为对角码个数乘上再加上水平和垂直像素点的个数的和。
11.2.2 边界直径
边界直径是边界上任意两点距离的最大值。
11.2.3 形状数
形状数是基于4-链码的边界描述符,形状数定义为值最小的4-链码的一阶差分码。先是找到原边界,再选取长度比最接近原边界的矩形以及相应坐标轴,将矩形进行等价格划分,四方向如下面的坐标所示,最后得到于边界最吻合多边形,七起始点用黑点标出。
链码:00300323222121101
一阶差分码:30310331300313031
形状数:00313031303103313
11.2.4 傅里叶描述子
图像边界点序列为,令
,记
,
,那么,傅里叶描述子公式为:
,
11.3 区域描述
11.3.1 区域面积与重心
区域面积可以函数求得,即:。
区域重心的计算公式如下:
11.3.2 欧拉数
1.像素的连接
对于二值图像中具有相同值的两个像素a和b,所有和a、b具有相同值的像素系列存在,并且
和
互为4-/8-邻接,那么像素a和b叫做4-/8-连接,以上的像素序列叫4-/8-路径。
2.连接成分
在二值图像中,把互相连接的像素的集合汇集为一组,于是具有若干个0值的像素(0像素)和具有若干个1值的像素(1像素)的组就产生了,把这些组叫做连接成分。如果把1-像素看成4-/8-连接,那么0-像素就必须用4-/8-连接。
3.欧拉数
在二值图像中,1像素连接成分数C减去孔数H的值叫做这幅图像的1欧拉数或示性数。若用E表示图像的欧拉数,则:。对于一个1像素连接成分,1减去这个连接成分中所包含的孔数的差值叫做这个1像素连接成分的欧拉数。显然,二值图像的欧拉数是所有1像素连接成分的欧拉数之和。
11.3.3 纹理
纹理反映像素灰度的空间分布属性的图像特征通常变现为局部不规则但宏观有规律性。
11.3.4 不变矩
阶矩:
中心矩:
重心坐标:
利用中心矩可以提取区域的一些基本形状特征,例如和
分别表示围绕通过灰度中心的垂直和水平轴线的惯性矩。假如
,则可能所计算的区域为一个水平方向延伸的区域。-当
时,区域关于i轴对称;当
时,区域关于j对称。
归一化的中心矩为
其中,
从上表可以看出,在图像经过旋转、镜像以及尺度变换之后,这七个不变矩的值只有十分小的变化,可以看作是基本保持不变。
参考文献:数字图像处理(第四版)冈萨雷斯