使用ocr识别的具体步骤(详细)

ocr识别 我们这里使用的是GitHub上面提供的一个ocr的识别(只要识别的是营养成分)

首先我们在训练之前需要做的事情 需要准备营养成分表(需要完整一些的),其次需要准备 python环境 下面我会附加一条链接告诉需要下载的东西。

https://github.com/wanghaisheng/awesome-ocr/wiki/Extracting-text-from-an-image-using-Ocropus-%E4%B8%AD%E6%96%87

ocr识别的大致步骤可以分为三个步 首先是将图片进行一个二值化处理,简单的说就是让图片的可读性更强一点。第二步就是将图片里面的一些成分含量进行一个分段 截取 ,然后会生成对象的txt,因为这里面可能会包含中文 默认是识别不了中文的 所以这个时候 我们就需要把带有中文的图片给转换一个(步骤:将对象生成的txt文件,复制,粘贴,然后重命名为后缀名为.gt.txt的文本,然后在将没有对应txt的图片给删除了,到这里还没有全部完成 ,我们还需要修改ocropy-->ocropy-1.3.3/ocrolib/chars.py 如图):

然后打开这个文件去把我们上面.gt.txt里面的内容全部都写到Chinese里面去(记住是全部的.gt.txt都要放入)如图:


第三步就是进行识别。下面附上代码


nohup python -u ocropus-rtrain --load food2-00000100.pyrnn.gz -o food2 food2/0001/*.bin.png    这一命令是当我们训练终止的时候,我们修改完错误 以后可以接着上面的模型继续进行训练


上面是训练模型 下面这一些是识别模型(xx:表示图片名称)

图片预处理,生成bin.png rnm.png 
1:python ocropus-nlbin -n test/xx.jpg -o food
图片分割 生成0001目录 里面存放切割好的图片
2:python ocropus-gpageseg -n --maxcolseps 0 food/0001.bin.png 
识别切割后的图片  并在0001目录生成识别结果文件,结果文件名:图片名.txt

3:python ocropus-rpred -m en-default.pyrnn.gz food/0001/*.png

然后我们打开分割后生成的txt文件和图片进行对比 即可

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值