用 tesseract 和 CxImage 扫描验证码

最新推荐文章于 2024-09-17 11:01:05 发布

timfun

最新推荐文章于 2024-09-17 11:01:05 发布

阅读量3.3k

点赞数 2

分类专栏：不知所谓文章标签：图像处理 windows google io

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/timfun/article/details/3930541

版权

不知所谓专栏收录该内容

1 篇文章 0 订阅

订阅专栏

之前一个扫描验证码的小程序,有使用到一google的开源ocr组件,很不幸的是这个组建里面没有直接支持jpg

图片的ocr，但我们的目标很多都用的是jpg格式的图片。我需要把目标转换成bmp格式才能提交给tessdll处理。

之间还有降噪,区域分割等部分处理,之前有一写文件IO的部分在里面,导致程序运行效率不是很好,今天我试了一下 CxImage 这个同样开源的图像处理组建,哈哈果然它就是我需要的。可以直接load内存里面的图片数据,进行ocr前的数据处理以提高ocr的精度。

到目前为止一切进行的都很好,当我把 CxImage中的数据提交给tesseract组件后我得到了"~"。识别不出来。于是又仔细的看了一下tsseract中 dlltest工程中的调用细节。发现里面内置的那个BMP的读取过程默默的为我们做了两件事情。这也就是我们今天要注意的两件事情：

1）把BMP图片里面的数据行进行了倒序。在Windows里BMP仿佛是从最后一行开始处理的。

在这里我们需要对BMP的数据行就行倒序操作。

2）BMP图片格式中数据是4个字节对齐的，是的这样可以提高访问的效率。也就是说对于BMP中的单行

数据来说。如果这一行数据的长度不是4的整数倍的话,后面自动补齐成4字节对齐的。这个当然没有问题

但是我们把图片数据传递给tesseract的时候这个自动补齐的部分是不能包含在里面的。我们要把它们去掉

即我们必须只保留那些真正表示图片内容的数据。

tesseract里面用 stride 来表示这个值正确的得到这个值也是这个过程里面的关键。

至于如何正确的得到这个值可以在 tesseract的示例工程中找到。

if (iBpp > 8)

{

iStride = (iWidth * iBpp + 7) / 8 ;

}

else

{

iStride = (iWidth + 8/iBpp -1) / (8 / iBpp) ;

}

其中iBpp 是 BMP中的 bpp值,iWidth 为图像的相熟宽度。

做好这两点,我们就可以利用CxImage的便利处理各种格式的图片了。哈哈 enjoy it~！

好记性不如烂笔头,记录下来提醒自己。

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄20年

2
原创

3
点赞

0
收藏

3
粉丝

关注

私信

热门文章

分类专栏

不知所谓 1篇

最新评论

用 tesseract 和 CxImage 扫描验证码
shanhuyijiao: 你好，这个我也碰到类似的问题了，具体要怎么处理呢？能否给我一小段关键的代码看看？ 1450258904@qq.com
用 tesseract 和 CxImage 扫描验证码
ILoveRMB: 高手，我也发现了这个程序，识别率不错，能否指点下，我想在自己的代码中调用。请教你是怎么调用的？ QQ 24327475 email:ilovevc@126.com 谢谢高手啊
用 tesseract 和 CxImage 扫描验证码
匿名用户: 嗯，和我做的方式一样。用人家的东西很简单啊，自己原创就难了。
用 tesseract 和 CxImage 扫描验证码
时间漩涡: 你好，这个我也碰到类似的问题了，具体要怎么处理呢？能否给我一小段关键的代码看看？
WTL8.0 appWizard for wince 在 vs2008 下的安装
larry_tang: 抄来抄去有意思吗，有没有自己试过啊，你做过WinCE开发吗，用过WTL吗？我也是这个问题，告诉你用这个方法不行！

最新文章

WTL8.0 appWizard for wince 在 vs2008 下的安装

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。