山东大学暑期项目实训(二)
阅读甲骨文识别文献,提取关键性方法思路
背景:几千年来,甲骨文一直深埋地下,很多甲骨被腐蚀,加之后来出土时的损坏,造成许多甲骨残缺不全,大多数的甲骨都有明显的裂痕,以此为原型的甲骨文图片往往残缺不全,字形模糊,含有很多噪声点。因此需要对甲骨文图片进行图像处理,目的就是为了去除背景和噪声,分割出甲骨文字体目标区域,对其进行边界提取和轮廓跟踪等操作,获取甲骨文原始字形轮廓线上的特征点,为下一步的工作做准备。
思路
1.对原始图像进行中值滤波去噪
中值滤波的主要原理是将数字图像中的某点用该点的邻域中各个像素值的中值所来代替,这样就能让目标像素周围能够更好的接近真实值,比如一张白纸上有一个黑点时,黑点的像素值比较大,经过中值滤波过后,黑点附近的像素值可能就会变小。经过中值滤波后一些相对孤立的噪声点就容易被清除掉,这样就能提高图像的质量。
2.改进的K-均值聚类进行图像分割
k-均值聚类的目的是:把n个点(可以是样本的一次观察或一个实例)划分到k个聚类中,使得每个点都属于离它最近的均值(此即聚类中心)对应的聚类,以之作为聚类的标准。
两种图像分割:一个是基于颜色特征的,另外一个是基于纹理特征。基于颜色特征的图像分割采用基于k-means 聚类的算法,其中用于聚类的颜色信息应该是出现在给定的图片中的。而基于纹理特征的图像分割应基于图像纹理基元直方图的k-means 聚类算法。link
3.膨胀、边界提取处理 link
图像膨胀是腐蚀操作的逆操作,类似于“领域扩张”,将图像中的高亮区域或白色部分进行扩张,其运行结果图比原图的高亮区域更大线条变粗了,主要用于去噪。
(1) 图像被腐蚀后,去除了噪声,但是会压缩图像。
(2) 对腐蚀过的图像,进行膨胀处理,可以去除噪声,并且保持原有形状。
它也包括两个输入对象:
(1)二值图像或原始图像
(2)卷积核
4.轮廓跟踪 link
甲骨文图像中文字目标区域的边界即为甲骨文字形的轮廓,边界提取目的是为了获取甲骨文原始字形的轮廓信息,对甲骨文进行边界提取也是下一步研究工作的前提。
图片来源 link
5.提取特征点 link
图像的特征点可以简单的理解为图像中比较显著显著的点,如轮廓点,较暗区域中的亮点,较亮区域中的暗点等。 ORB采用FAST(features from accelerated segment test)算法来检测特征点。