tesseract识别图片中文字(一)

这篇博客介绍了如何利用Tesseract OCR库在复杂背景下提取和识别文本。首先,通过提取文本行并进行二值化处理来减少非文本区域的影响。接着,对文本行进行归一化,并进一步优化二值化效果以去除背景干扰。最后,应用Tesseract进行文字识别。
摘要由CSDN通过智能技术生成
 

  一、对于复杂背景中的文本提取

 我测试用的简单的单行文本,如果非文本区多对二值化影响大,首先进行提取文本行,再对提取的文本行进行二值化。

实例图片:

图片中的文字区域从此视频帧中提取:

1、切取图片中的行

      提取边缘信息,边缘图像进行水平投影,将每一行中的像素值相加,得到一个每行边缘信息的数组,

求数组的波谷,两个波谷直接的区间就为文本行。

     求取波谷,我也没想到什么好的算法,因为数组是有波动的,只提取极小值也不对,会提取到特别多个波谷。

 下一步想平滑后求极小值。

目前切行后为:

 

2、对文本行归一化到一定的高

      按原来的宽高比对图片进行缩放,缩放到高为80个像素点(看论文里的经验值),便于文本的识别。

 

        float ratioWH = (float)(image->width)/image->height;
	CvSize cv;
	cv.height = 80;//将文字行比例转换为高80
	cv.width 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值