字符分割

最新推荐文章于 2020-12-04 14:13:42 发布

Do it !

最新推荐文章于 2020-12-04 14:13:42 发布

阅读量2k

点赞数 1

分类专栏：字符分割文章标签：字符分割

本文链接：https://blog.csdn.net/s12244315/article/details/49700487

版权

字符分割专栏收录该内容

2 篇文章 0 订阅

订阅专栏

ANN在训练和识别时都只能将一个单独的数字作为样本，因此对于扫描图像中的多个连续数字需要进行分割。具体算法如下：

1，确定图像中字符的大致高度范围：先自下而上对图像进行逐行扫描，直到遇到第一个黑素像素，记下行号，然后自上而下对图像进行逐行扫描，直到遇到第一个黑素像素，记下行号。这两个行号就标志出了字符大致的高度范围。

2，确定每个字符的左起始和右终止位置：在第一步得到的高度范围内进行自左向右逐列扫描，遇到第一个黑色像素时，认为是字符分割的起始位，然后继续扫描，直到遇到有一列中没有黑色像素，认为是这个字符的右终止位置，准备开始进行下一个字符的分割。按照上述方法继续扫描，直到扫描到图像的最右端。这样就得到了每个字符的比较精确的快读范围。

3，在已知的每个字符比较精确的宽度范围内，再按照第一步的方法，分别自下而上和自上而下，逐行扫描，来获取每个字符精确的高度范围。

完整实现代码如下：

/****************************************************************
参数：  对前景目标（如字符）进行划分，将各个字符的轮廓矩形返回
注  ：  只能处理二值图像
返回值：无
***************************************************************/
void Ctry::ObjectSegment()
{
	// TODO:  在此添加命令处理程序代码
	IplImage* img = cvLoadImage("C:\\Users\\Administrator\\Desktop\\dst.jpg", -1);
	vector<RECT> vecRoughRECT;    //粗略对象轮廓的矩形向量数组
	vector<RECT> vecRECT;                 //精化后对象轮廓的矩形向量数组

	//清空用来表示每个对象的vector
	vecRoughRECT.clear();
	vecRECT.clear();

	int nTop, nBttom;   //整体前景区域的上下边界
	int nObjCnt = 0;      //对象数目

   //从上向下扫描，找到整体区域的前景的上边界
	for (int i = 0; i < img->height; i++)
	{
		for (int j = 0; j < img->width; j++)
		{
			double pixel = cvGetReal2D(img, i, j);
			if (int(pixel)==0)
			{
				nTop = i;
				i = img->height;   //对i赋大值，使得在break跳出内存循环后，直接在跳出外层循环
				break;
			}
		}
	}

	//从下向上扫描，找到整体区域的前景的下边界
	for (int i = img->height -1; i >=0; i--)
	{
		for (int j = 0; j < img->width; j++)
		{
			double pixel = cvGetReal2D(img, i, j);
			if (int(pixel) == 0)
			{
				nBttom = i;
				i = -1;   //对i赋小值，使得在break跳出内存循环后，直接在跳出外层循环
				break;
			}
		}
	}

	bool bStartSeg = false;      //是否已经开始某一个对象的分割
	bool bBlackInCol;             //某一列中是否包含黑色像素

	RECT rt;

	//按列扫描，找到每一个目标的左右边界
	for (int j = 0; j < img->width; j++)
	{
		bBlackInCol = false;
		for (int i = 0; i < img->height; i++)
		{
			double pixel = cvGetReal2D(img, i, j);
			if (int(pixel) == 0)
			{
				bBlackInCol = true;     //该列中发现黑点
				if (!bStartSeg)  //还没有进入一个对象的分割
				{
					bStartSeg = true;//进入一个对象的分割
					rt.left = j;
				}
				else
					break;
			}
		}
		if (j == (img->width - 1))   //扫描到最后一列了，说明整个图像扫描完毕
		{
			break;
		}
		//正处在分割状态，且扫描完一列都没有发现黑像素，表明当前对象分割完毕
		if (bStartSeg && !bBlackInCol)
		{
			rt.right = j;     //对象右边界确定

			//对象的粗略上下边界（有待精化）
			rt.top = nTop;
			rt.bottom = nBttom;
			::InflateRect(&rt, 1, 1);  //矩形框膨胀一个像素，以免绘制时压到字符
			vecRoughRECT.push_back(rt);   //插入vector
			bStartSeg = false;   //当前分割结束
			nObjCnt++;   //对象数目加1
		}
	}

	RECT rtNEW;     //存放精化对象区域的矩形框
	//由于得到了精确的左右边界，现在可以精化矩形框的上下边界
	int nSize = vecRoughRECT.size();
	for (int nObj = 0; nObj < nSize; nObj++)
	{
		rt = vecRoughRECT[nObj];
		rtNEW.left = rt.left - 1;
		rtNEW.right = rt.right + 1;
		//从上向下逐行扫描边界
		for (int i = rt.top; i < rt.bottom; i++)
		{
			for (int j = rt.left; j < rt.right; j++)
			{
				double pixel = cvGetReal2D(img, i, j);
				if (int(pixel) == 0)
				{
					rtNEW.top = i - 1;
					//对i赋大值，使得在break跳出内存循环后，直接在跳出外层循环
					i = rt.bottom;
					break;
				}
			}
		}

		//从下向上逐行扫描边界
		for (int i = rt.bottom - 1; i > rt.top; i--)
		{
			for (int j = rt.left; j < rt.right; j++)
			{
				double pixel = cvGetReal2D(img, i, j);
				if (int(pixel) == 0)
				{
					rtNEW.bottom = i + 1;
					//对i赋小值，使得在break跳出内存循环后，直接在跳出外层循环
					i = rt.top-1;
					break;
				}
			}
		}
		vecRECT.push_back(rtNEW);
	}
	//画矩形框，显示分割字符
	for (int i = 0; i < vecRECT.size(); i++)
	{
		int x = vecRECT[i].left-1;
		int y = vecRECT[i].top-1;
		int x1 = vecRECT[i].right+1;
		int y1 = vecRECT[i].bottom + 1;
		CvPoint pt1(x, y);
		CvPoint pt2(x1, y1);
		cvRectangle(img, pt1, pt2, CV_RGB(255, 0, 0), 1);
	}
	cvSaveImage("C:\\Users\\Administrator\\Desktop\\rect.jpg", img);
	cvNamedWindow("image1", 1);
	cvShowImage("image1", img);
	cvWaitKey(0);
	cvDestroyWindow("image1");
	cvReleaseImage(&img);
}

效果图：

注：此算法对图像的进行处理前，需要对图形进行预处理，尤其是去噪，这里代码没有给出。图片质量不好，或预处理方法不对，效果也就不理想。

Do it !

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
字符分割

ANN在训练和识别时都只能将一个单独的数字作为样本，因此对于扫描图像中的多个连续数字需要进行分割。具体算法如下： 1，确定图像中字符的大致高度范围：先自下而上对图像进行逐行扫描，直到遇到第一个黑素像素，记下行号，然后自上而下对图像进行逐行扫描，直到遇到第一个黑素像素，记下行号。这两个行号就标志出了字符大致的高度范围。 2，确定每个字符的左起始和右终止位置：在第一步得到
复制链接

扫一扫

专栏目录