使用ocr识别的具体步骤（详细）

最新推荐文章于 2024-08-15 09:13:59 发布

软件三班刘同学

最新推荐文章于 2024-08-15 09:13:59 发布

阅读量1.3w

点赞数 2

本文链接：https://blog.csdn.net/qq_39086076/article/details/80576424

版权

ocr识别我们这里使用的是GitHub上面提供的一个ocr的识别（只要识别的是营养成分）

首先我们在训练之前需要做的事情需要准备营养成分表（需要完整一些的），其次需要准备 python环境下面我会附加一条链接告诉需要下载的东西。

https://github.com/wanghaisheng/awesome-ocr/wiki/Extracting-text-from-an-image-using-Ocropus-%E4%B8%AD%E6%96%87

ocr识别的大致步骤可以分为三个步首先是将图片进行一个二值化处理，简单的说就是让图片的可读性更强一点。第二步就是将图片里面的一些成分含量进行一个分段截取，然后会生成对象的txt，因为这里面可能会包含中文默认是识别不了中文的所以这个时候我们就需要把带有中文的图片给转换一个（步骤：将对象生成的txt文件，复制，粘贴，然后重命名为后缀名为.gt.txt的文本，然后在将没有对应txt的图片给删除了，到这里还没有全部完成，我们还需要修改ocropy-->ocropy-1.3.3/ocrolib/chars.py 如图）:

然后打开这个文件去把我们上面.gt.txt里面的内容全部都写到Chinese里面去(记住是全部的.gt.txt都要放入)如图:

第三步就是进行识别。下面附上代码

nohup python -u ocropus-rtrain --load food2-00000100.pyrnn.gz -o food2 food2/0001/*.bin.png 这一命令是当我们训练终止的时候，我们修改完错误以后可以接着上面的模型继续进行训练

上面是训练模型下面这一些是识别模型（xx:表示图片名称）

图片预处理，生成bin.png rnm.png
1：python ocropus-nlbin -n test/xx.jpg -o food
图片分割生成0001目录里面存放切割好的图片
2:python ocropus-gpageseg -n --maxcolseps 0 food/0001.bin.png
识别切割后的图片并在0001目录生成识别结果文件，结果文件名：图片名.txt

3:python ocropus-rpred -m en-default.pyrnn.gz food/0001/*.png

然后我们打开分割后生成的txt文件和图片进行对比即可