Crnn中文end-to-end识别

最新推荐文章于 2024-05-23 21:36:03 发布

大熊吃土豆

最新推荐文章于 2024-05-23 21:36:03 发布

阅读量5.1w

点赞数 20

分类专栏：深度学习文章标签：开源项目 github 文字检测

本文链接：https://blog.csdn.net/u013293750/article/details/73188934

版权

中文识别利用crnn训练英文的网络来训练中文，字符个数5529左右，中文的顺序按照tesseract开源项目复制过来的。

github:
https://github.com/bear63/sceneReco
model:
https://pan.baidu.com/s/1i5OLwt3 crnn文字识别模型
https://pan.baidu.com/s/1i4Hd9zv ctpn文字检测模型
1:样本获取

**算法论文:**
      Synthetic Data for Text Localisation in Natural Images
      Github: https://github.com/ankush-me/SynthText
**词库:**
     https://pan.baidu.com/s/10anmu  + 英文词汇 经过处理后得到大约500兆
     6000万词组
**字体:**
    ubntu系统下支持中文的字体，选了大概10种字体左右
**背景图片库:**
   http://zeus.robots.ox.ac.uk/textspot/static/db/bg_img.tar.gz
   大约有一万张分割好的图片
**算法大致过程:**
   随机从背景图片库中选出一张图片，随机从词库中选出一些词组，与背景图片分割                 -      的块进行匹配，选好字体，颜色，大小&#