中文文字识别项目训练

最新推荐文章于 2023-07-14 11:50:13 发布

VIP文章钟鸣鼎列

最新推荐文章于 2023-07-14 11:50:13 发布

阅读量997

点赞数

本文链接：https://blog.csdn.net/qq_44851392/article/details/106439794

版权

一、项目说明
算法是https://github.com/YCG09/chinese_ocr，这是基于Tensorflow和keras框架采用ctpn+densenet+CTC算法来完成对图片指定内容的字符识别。
数据集我用的是项目提供的，也可以自己标注，可以参考这篇博客https://blog.csdn.net/weixin_42861043/article/details/89705021
二、CTPN训练
按照read.me训练即可，有问题可以参考下这篇帖子https://www.cnblogs.com/xiaoyh/p/12183339.html的ctpn训练部分。
三、DenseNet+CTC训练
我用的项目里给的数据集，如果你用自己的数据集记得先裁剪成细条状，然后对图像进行resize工作，resize代码如下（仅供参考）。
from PIL import Image import os.path import glob def convertjpg(jpgfile,outdir,width=280,height=32): # img=Image.open(jpgfile) try: new_img=img.resize((width,height),Image.BILINEAR) new_img.save(os.path.join(outdir,os.path.basename(jpgfile))) except Exception as e: print(e) for jpgfile in glob.glob("/home/ctpn+densenet+ctc/train/images01/*.jpg"): #原始图片文件夹 convertjpg(jpgfile,"/home/ctpn+densenet+ctc/train/001images") #处理之后的图片文件夹
然后把这个项目

最低0.47元/天解锁文章

钟鸣鼎列

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
中文文字识别项目训练

一、项目说明算法是https://github.com/YCG09/chinese_ocr，这是基于Tensorflow和keras框架采用ctpn+densenet+CTC算法来完成对图片指定内容的字符识别。数据集我用的是项目提供的，也可以自己标注，可以参考这篇博客https://blog.csdn.net/weixin_42861043/article/details/89705021二、CTPN训练按照read.me训练即可，有问题可以参考下这篇帖子https://www.cnblogs.co
复制链接

扫一扫