假设有如下一张图,如何把其中的文本分块切割出来,比如“华普超市朝阳门店”、“2015-07-26”就是两个文本块。
做图像切割有很多种方法,本文描述一种最直观的投影检测法。先来看看什么是投影,简单来说,投影就是在一定方向上有效像素的数量。来看个直观的图像:
这是一张水平投影图与原图的对比,从投影图上能看到多个波峰,文字多的地方,投影就长,行间的空白处,投影为0。 上个示例代码:public void HorizontalProjection()
{
//以灰度图方式读入源文件
string filename = "source.jpg";
var src = IplImage.FromFile(filename, LoadMode.GrayScale);
//二值化,采用阈值分割法
Cv.Threshold(src, src, 0, 255, ThresholdType.BinaryInv | ThresholdType.Otsu);
//存储投影值的数组
var h = new int[src.Height];
//对每一行计算投影值
for(int y = 0;y
{
//遍历这一行的每一个像素,如果是有效的,累加投影值
for(int x = 0;x
{
var s = Cv.Get2D(src, y, x);
if(s.Val0 == 255)
h[y]++;
}
}
//准备一个图像用于画投影图
var paintY = Cv.CreateImage(src.Size, BitDepth.U8, 1);
Cv.Zero(paintY);
//画图
var t = new CvScalar(255);
for(int y =