中文文字识别项目训练

一、项目说明
算法是https://github.com/YCG09/chinese_ocr,这是基于Tensorflow和keras框架采用ctpn+densenet+CTC算法来完成对图片指定内容的字符识别。
数据集我用的是项目提供的,也可以自己标注,可以参考这篇博客https://blog.csdn.net/weixin_42861043/article/details/89705021
二、CTPN训练
按照read.me训练即可,有问题可以参考下这篇帖子https://www.cnblogs.com/xiaoyh/p/12183339.html的ctpn训练部分。
三、DenseNet+CTC训练
我用的项目里给的数据集,如果你用自己的数据集记得先裁剪成细条状,然后对图像进行resize工作,resize代码如下(仅供参考)。
from PIL import Image import os.path import glob def convertjpg(jpgfile,outdir,width=280,height=32): # img=Image.open(jpgfile) try: new_img=img.resize((width,height),Image.BILINEAR) new_img.save(os.path.join(outdir,os.path.basename(jpgfile))) except Exception as e: print(e) for jpgfile in glob.glob("/home/ctpn+densenet+ctc/train/images01/*.jpg"): #原始图片文件夹 convertjpg(jpgfile,"/home/ctpn+densenet+ctc/train/001images") #处理之后的图片文件夹
然后把这个项目

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值