识别项目-2

最新推荐文章于 2019-06-14 11:00:04 发布

这合适吗

最新推荐文章于 2019-06-14 11:00:04 发布

阅读量528

点赞数

分类专栏：图像识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35804114/article/details/88712025

版权

图像识别专栏收录该内容

1 篇文章 0 订阅

订阅专栏

>>>2019.3.21

进入第二阶段

使用tesseract开源API进行字符的识别

目标：识别出图像中的等号并获得其坐标

参考代码：

https://stackoverflow.com/questions/18715742/how-to-get-the-letter-coordinate-retrieved-by-tesseract-ocr

https://github.com/sirfz/tesserocr Iterator over the classifier choices for a single symbol

结合上面的两份代码之后就可以使用tesseract的python接口对字符进行识别，能获得字符的坐标，并识别出大部分的等号。需要注意的是不要用截屏出来的图片进行识别，因为这样获得的图片可能会造成图片的dpi达不到tesseract的要求，使得识别的效果变差。

为了提高识别的准确度，采用jTessBoxEditor工具训练自己的数据，参考了以下博客

https://blog.csdn.net/qq_40147863/article/details/82290015#commentsedit

在获取样本文件步骤，使用了photoshop工具对整张图像进行切片处理，获得20道算术题目图片并用格式工厂转换为.tif文件作为样本数据

样本数据百度盘链接:https://pan.baidu.com/s/1SNBKwsZUZkAnrRS5y7gieg 密码:cjoq

在windows10平台上安装tesseract步骤参考以下博客

https://blog.csdn.net/qq_40147863/article/details/82285920

注意安装的tesseract的版本，使用博客中提供的进行安装就可以，如果是自己找的最新版本安装可能会出现找不到系统文件icuuc63.dll icuin63.dll 的错误

按照上篇博客做下来，不出意外的话最后就能得到我们想要的traindata文件，在代码中设置引用这个训练文件就能将全部的等号识别出来

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
识别项目-2

>>>2019.3.21进入第二阶段使用tesseract开源API进行字符的识别目标：识别出图像中的等号并获得其坐标参考代码：https://stackoverflow.com/questions/18715742/how-to-get-the-letter-coordinate-retrieved-by-tesseract-ocrhttps://git...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。