一、项目说明
算法是https://github.com/YCG09/chinese_ocr,这是基于Tensorflow和keras框架采用ctpn+densenet+CTC算法来完成对图片指定内容的字符识别。
数据集我用的是项目提供的,也可以自己标注,可以参考这篇博客https://blog.csdn.net/weixin_42861043/article/details/89705021
二、CTPN训练
按照read.me训练即可,有问题可以参考下这篇帖子https://www.cnblogs.com/xiaoyh/p/12183339.html的ctpn训练部分。
三、DenseNet+CTC训练
我用的项目里给的数据集,如果你用自己的数据集记得先裁剪成细条状,然后对图像进行resize工作,resize代码如下(仅供参考)。
from PIL import Image import os.path import glob def convertjpg(jpgfile,outdir,width=280,height=32): # img=Image.open(jpgfile) try: new_img=img.resize((width,height),Image.BILINEAR) new_img.save(os.path.join(outdir,os.path.basename(jpgfile))) except Exception as e: print(e) for jpgfile in glob.glob("/home/ctpn+densenet+ctc/train/images01/*.jpg"): #原始图片文件夹 convertjpg(jpgfile,"/home/ctpn+densenet+ctc/train/001images") #处理之后的图片文件夹
然后把这个项目
中文文字识别项目训练
最新推荐文章于 2023-07-14 11:50:13 发布