OCR_recognition
以实战为线索,逐步深入OCR文本检测识别研发各个环节,掌握思路,打造完整的工作流,提升工程化编码能力和思维能力。
libo-coder
DeepLearning / Computer Vision / OCR
展开
-
『OCR_recognition』chineseocr
文章目录一、Chineseocr 识别流程二、Darknet 提取 text_proposals一、Chineseocr 识别流程step 1: 文字方向检测包含:VGG16 的一个四分类算法(0,90,180,270),小角度的检测,estimate_skew_angle该步骤可以跳过,因为算法在一定角度范围内具有鲁棒性step 2: 文本检测用 yolo 检测出含有文本框的区域 text_proposals;Note:图像输入固定压缩到 608*608,框的宽度固定为 8,高原创 2020-12-28 12:14:39 · 1281 阅读 · 0 评论 -
『OCR_recognition』CTC loss几种解码方式
文章目录前言一、贪心搜索 (greedy search)1.1 原理解释1.2 图示说明1.3 代码实现二、束搜索(Beam Search)2.1 原理解释2.2 图示说明2.3 代码实现三、前缀束搜索(Prefix Beam Search)3.1 原理解释3.2 图示说明3.3 代码实现参考链接前言预测新的样本输入对应的输出字符串,这涉及到解码。按照最大似然准则,最优的解码结果为:示例:如上图的例子,按照时间序列展开得到栅格网络,解码的过程相当于空间搜索, 求取穷举的所有可能字符串序列中概原创 2020-12-26 11:08:43 · 1541 阅读 · 3 评论 -
『OCR_Recognition』CRNN
文章目录前言一、CRNN1.1 CRNN 介绍1.2 CRNN 网络结构1.2.1 CNN1.2.2 Map-to-Sequence1.2.3 RNN1.2.4 CTC Loss1.2.4.1 序列合并机制1.2.4.2 训练阶段参考链接前言现今基于深度学习的端到端 OCR 技术有两大主流技术:CRNN OCR 和 attention OCR。其实这两大方法主要区别在于最后的输出层(翻译层),即怎么将网络学习到的序列特征信息转化为最终的识别结果。这两大主流技术在其特征学习阶段都采用了 CNN+RNN原创 2020-12-24 09:16:57 · 5201 阅读 · 6 评论 -
『OCR_recognition』crnn-finetune 模型学习率调整策略
一、网络模型二、不同层设置不同学习率以优化器 Adam 为例:# 不同层设置不同的学习率train_params = list(map(id,crnn.rnn.parameters()))rest_params = filter(lambda x:id(x) not in train_params, crnn.parameters())# loss averagerloss_avg = utils.averager() # 对loss取平均对象# setup optimizerif原创 2020-12-08 15:18:14 · 700 阅读 · 0 评论