1 图片横线,竖线及文字的提取原理
图像形态学操作时候,可以通过自定义的结构元素实现结构元素对输入图像一些对象敏感、另外一些对象不敏感,这样就会让敏感的对象改变而不敏感的对象保留输出。通过使用两个最基本的形态学操作-膨胀与腐蚀,使用不同的结构元素实现对输入图像的操作、得到想要的结果。
- 膨胀,输出的像素值是结构元素覆盖下输入图像的最大像素值
- 腐蚀,输出的像素值是结构元素覆盖下输入图像的最小像素值
1-1 二值图像:
二值图像每个像素只有两种取值:要么纯黑,要么纯白; 用0或1表示
1-2 灰度图像:
灰度图就是黑白两色在深度上面的变化256种黑白灰度颜色;用0 - 255表示
1-3 转换为二值图像:
void adaptiveThreshold(InputArray src, OutputArray dst, double maxValue, int adaptiveMethod, int thresholdType, int bolckSize, double C)
src :输入图像,填单通道
dst :即为输出图像(与输入图像同样的尺寸和类型)
maxValue :预设满足条件的最大值
adaptiveMethod :指定自适应阈值算法。可选择ADAPTIVE_THRESH_MEAN_C 或 ADAPTIVE_THRESH_GAUSSIAN_C两种
thresholdType :指定阈值类型。可选择THRESH_BINARY或者THRESH_BINARY_INV两种。(即二进制阈值或反二进制阈值)。
bolckSize :表示邻域块大小,用来计算区域阈值,一般选择为3、5、7......等。
C :参数C表示与算法有关的参数,它是一个从均值或加权均值提取的常数,可以是负数。
2 图片横线,竖线及文字的提取方法
- 输入图像彩色图像imread
- 转换为灰度图像-cvtColor
- 转换为二值图像-adaptiveThreshold
- 定义结构元素
- 开操作(腐蚀+膨胀) 提取水平线,垂直线和文字
3 代码示例
#include <opencv2/opencv.hpp>
#include <iostream>
#include <math.h>
using namespace cv;
int main(int argc, char** argv)
{
Mat src, dst;
src = imread("pickABC.png");
if (!src.data) //判断图片是否加载成功!
{
std::cout << "打开图片失败!" << std::endl;
return -1;
}
//namedWindow("src image", CV_WINDOW_AUTOSIZE);
imshow("src image", src);
//原图转换灰度图像
Mat gray_mat;
cvtColor(src,gray_mat,CV_BGR2GRAY);
imshow("gray_mat", gray_mat);
//灰度图像转二值图像
Mat twoval_mat;
adaptiveThreshold(~gray_mat, twoval_mat,255,ADAPTIVE_THRESH_MEAN_C,THRESH_BINARY,15,-2);
imshow("twoval_mat", twoval_mat);
//定义水平和垂直结构元素
Mat hline = getStructuringElement(MORPH_RECT,Size(src.cols/16,1),Point(-1,-1));
Mat vline = getStructuringElement(MORPH_RECT, Size(1,src.rows/16), Point(-1, -1));
Mat mystruct = getStructuringElement(MORPH_RECT, Size(3,3), Point(-1, -1));
Mat temp;
//开操作
//erode(twoval_mat, temp, hline);
//dilate(temp, dst, hline);
morphologyEx(twoval_mat,dst,CV_MOP_OPEN, mystruct);
bitwise_not(dst, dst);
imshow("dst image", dst);
waitKey(100000);
return 0;
}