使用OpenCv中Mat进行水平投影与垂直投影并实现字符切分

最新推荐文章于 2024-08-03 21:22:09 发布

kim9511

最新推荐文章于 2024-08-03 21:22:09 发布

阅读量1w

点赞数 11

分类专栏： OpenCv 文章标签： opencv 垂直投影水平投影字符切分

本文链接：https://blog.csdn.net/m0_38025293/article/details/70182513

版权

OpenCv 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

因为要做图像处理方面的工作，所以最近在学习OpenCv的使用，学习了OpenCv中Mat对象的相关使用之后，实现了使用Mat对象来进行图像的水平投影和垂直投影，并且在投影之后，对字符进行相对应的切分。现在将相关代码贴出，一来可以供大家参考并指正错误，而来也为的是防止忘记了相关知识。以下就是程序的代码，欢迎大家指正错误。

#include <stdafx.h>
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include <iostream>
#include <stdio.h>
using namespace cv;
using namespace std;

vector<Mat> horizontalProjectionMat(Mat srcImg)//水平投影
{
	Mat binImg;
	blur(srcImg, binImg, Size(3, 3));
	threshold(binImg, binImg, 0, 255, CV_THRESH_OTSU);
	int perPixelValue = 0;//每个像素的值
	int width = srcImg.cols;
	int height = srcImg.rows;
	int* projectValArry = new int[height];//创建一个储存每行白色像素个数的数组
	memset(projectValArry, 0, height * 4);//初始化数组
	for (int col = 0; col < height; col++)//遍历每个像素点
	{
		for (int row = 0; row < width; row++)
		{
			perPixelValue = binImg.at<uchar>(col, row);
			if (perPixelValue == 0)//如果是白底黑字
			{
				projectValArry[col]++;
			}
		}
	}
	Mat horizontalProjectionMat(height, width, CV_8UC1);//创建画布
	for (int i = 0; i < height; i++)
	{
		for (int j = 0; j < width; j++)
		{
			perPixelValue = 255;
			horizontalProjectionMat.at<uchar>(i, j) = perPixelValue;//设置背景为白色
		}
	}
	for (int i = 0; i < height; i++)//水平直方图
	{
		for (int j = 0; j < projectValArry[i]; j++)
		{
			perPixelValue = 0;
			horizontalProjectionMat.at<uchar>(i, width - 1 - j) = perPixelValue;//设置直方图为黑色
		}
	}
	vector<Mat> roiList;//用于储存分割出来的每个字符
	int startIndex = 0;//记录进入字符区的索引
	int endIndex = 0;//记录进入空白区域的索引
	bool inBlock = false;//是否遍历到了字符区内
	for (int i = 0; i <srcImg.rows; i++)
	{
		if (!inBlock && projectValArry[i] != 0)//进入字符区
		{
			inBlock = true;
			startIndex = i;
		}
		else if (inBlock && projectValArry[i] == 0)//进入空白区
		{
			endIndex = i;
			inBlock = false;
			Mat roiImg = srcImg(Range(startIndex, endIndex + 1), Range(0, srcImg.cols));//从原图中截取有图像的区域
			roiList.push_back(roiImg);
		}
	}
	delete[] projectValArry;
	return roiList;
}
vector<Mat> verticalProjectionMat(Mat srcImg)//垂直投影
{
	Mat binImg;
	blur(srcImg, binImg, Size(3, 3));
	threshold(binImg, binImg, 0, 255, CV_THRESH_OTSU);
	int perPixelValue;//每个像素的值
	int width = srcImg.cols;
	int height = srcImg.rows;
	int* projectValArry = new int[width];//创建用于储存每列白色像素个数的数组
	memset(projectValArry, 0, width * 4);//初始化数组
	for (int col = 0; col < width; col++)
	{
		for (int row = 0; row < height;row++)
		{
			perPixelValue = binImg.at<uchar>(row, col);
			if (perPixelValue == 0)//如果是白底黑字
			{
				projectValArry[col]++;
			}
		}
	}
	Mat verticalProjectionMat(height, width, CV_8UC1);//垂直投影的画布
	for (int i = 0; i < height; i++)
	{
		for (int j = 0; j < width; j++)
		{
			perPixelValue = 255;  //背景设置为白色
			verticalProjectionMat.at<uchar>(i, j) = perPixelValue;
		}
	}
	for (int i = 0; i < width; i++)//垂直投影直方图
	{
		for (int j = 0; j < projectValArry[i]; j++)
		{
			perPixelValue = 0;  //直方图设置为黑色  
			verticalProjectionMat.at<uchar>(height - 1 - j, i) = perPixelValue;
		}
	}
	imshow("垂直投影",verticalProjectionMat);
    cvWaitKey(0);
	vector<Mat> roiList;//用于储存分割出来的每个字符
	int startIndex = 0;//记录进入字符区的索引
	int endIndex = 0;//记录进入空白区域的索引
	bool inBlock = false;//是否遍历到了字符区内
	for (int i = 0; i < srcImg.cols; i++)//cols=width
	{
		if (!inBlock && projectValArry[i] != 0)//进入字符区
		{
			inBlock = true;
			startIndex = i;
		}
		else if (projectValArry[i] == 0 && inBlock)//进入空白区
		{
			endIndex = i;
			inBlock = false;
			Mat roiImg = srcImg(Range(0, srcImg.rows), Range(startIndex, endIndex + 1));
			roiList.push_back(roiImg);
		}
	}
	delete[] projectValArry;
	return roiList;
}
int main(int argc, char* argv[])
{
        Mat srcImg = imread("E:\\b.png", 0);//读入原图像
       char szName[30] = { 0 };	
	    vector<Mat> b = verticalProjectionMat(srcImg);//先进行垂直投影	
		for (int i = 0; i < b.size(); i++)
		{
			vector<Mat> a = horizontalProjectionMat(b[i]);//水平投影
			sprintf(szName,"E:\\picture\\%d.jpg",i);
			for (int j = 0; j < a.size(); j++)
			{
				imshow(szName,a[j]);
				IplImage img = IplImage(a[j]);
				cvSaveImage(szName, &img);//保存切分的结果
			}
		}
	 /*
		vector<Mat> a = horizontalProjectionMat(srcImg);
		char szName[30] = { 0 };
		for (int i = 0; i < a.size(); i++)
		{
			vector<Mat> b = verticalProjectionMat(a[i]);
			for (int j = 0; j<b.size();j++)
			{
				sprintf(szName, "E:\\%d.jpg", j);
				imshow(szName, b[j]);
			}
		}
		 */
		cvWaitKey(0);
		getchar();
	    return 0;
}

以下是程序的结果截图：

（1）原始图像

（2）垂直投影

（3）水平投影

（4）字符切分

由于水平切分的结果只有一个，而垂直切分的结果有多个，所以应该要先进行垂直切分，然后再进行水平切分，这样得到的结果才是切分出字符的大小。若是先进行水平切分，而后进行垂直切分的话，得到的结果就并非要切割出的字符的大小，改代码已经给出，即注释掉的代码，而先进行水平切分，再进行垂直切分的结果如下图所示：

（5）先水平后垂直

可以看到，有的切分出的图像，上下仍然有空白的地方。所以，先水平后垂直的切分方法不适合于本程序的要求。
以上是本人的一点见解，有什么不正确的地方，欢迎指正。

kim9511

关注

11
点赞
踩
50

收藏

觉得还不错? 一键收藏
5
评论
使用OpenCv中Mat进行水平投影与垂直投影并实现字符切分

因为要做图像处理方面的工作，所以最近在学习OpenCv的使用，学习了OpenCv中Mat对象的相关使用之后，实现了使用Mat对象来进行图像的水平投影和垂直投影，并且在投影之后，对字符进行相对应的切分。现在将相关代码贴出，一来可以供大家参考并指正错误，而来也为的是防止忘记了相关知识。以下就是程序的代码，欢迎大家指正错误。#include #include "opencv2/imgproc/im
复制链接

扫一扫

专栏目录