chinese-ocr中文字行检测+OCR识别训练自己的数据以及pb文件转换实战

GitHub地址:https://github.com/YCG09/chinese_ocr

该项目检测使用ctpn,识别使用cnn+lstm形式,通过GitHub给出的readme可以直接运行demo.py看到作者训练好的检测加识别的最终结果。

此处将该项目在自己的数据集上训练过程加以记录,并将最终识别结果转为pb文件。

检测模型:进入ctpn/prepare_training_data目录下,修改split_label_new.py文件。(先将自己的数据存放到一个目录,每个图像对应一个同名的.txt文件,txt文件中对应图片中文字行坐标信息,可以是四点坐标,也可以是八点坐标,图片中有多少行文字信息,txt中就有多少行label,label按照【xmin ymin xmax ymax】的形式,或者【左上 右上 右下 左下】的八点坐标存放,我有两种数据格式,所以四点坐标和八个点坐标都有),注释掉第一行gt_path,将path变量指向数据目录,将原始的file变量更改为数据目录下所有的图片,自己改就行,我的代码为files = [os.path.join(path,e) for e in os.listdir(path) if e.endswith('.jpg')],后面的for循环读取图片对应的label的时候,做一个判断,因为ctpn检测网络是自然场景下的文字行检测,所以label都是八个点坐标,这里判断如果label为四个点坐标,那就计算出八个点坐标就行,很简单的,然后执行split_label_new.py文件,在当前目录就能产生两个目录label_

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

洛希极限-cz

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值