【OCR技术系列之一】字符识别技术总览,从前辈的文章我看到,印刷过程中字体很可能变得断裂或者墨水粘连,那么通过什么样的技术解决此问题呢?
OCR技术系列之二】文字定位与切割,现在的技术还需要将每一个字符从图片中切割下来吗?采用end-to-end的方式,就不用那么麻烦了。
AI学习笔记——End-to-End(端到端)的深度学习,正因为end-to-end不需要,所以他需要大量的训练样本。【OCR技术系列之七】端到端不定长文字识别CRNN算法详解显示的加入文字切割环节已经过时了,现在采用的是端到端的OCR技术,已经将文字识别转化为序列学习。
1 CRNN
1.1 CPTN
OCR技术系列之五】自然场景文本检测技术综述(CTPN, SegLink, EAST),【OCR技术系列之六】文本检测CTPN的代码实现,
1.2 CRNN
【OCR技术系列之八】端到端不定长文本识别CRNN代码实现,看了这篇文章,才发现神经网络的训练集是多么麻烦。下面文本清单中有两列数据,一列对应图片的编码,一列对应图片中的内容。
1.2.1 CTC
CTC(Connectionist Temporal Classification)介绍
1.2.2 LSTM
深度学习:人人都能看懂的LSTM,
查看LSTM原理及实现可能会稍微明白一点,但我还是没有完全理解。
2 图像矫正
OpenCV探索之路(十六):图像矫正技术深入探讨
2.1 掩膜mask
图像中的掩膜(Mask)是什么,详解掩膜mask,其实将就是将感兴趣区给遮住。
2.2 轮廓提取的矫正算法
基于轮廓提取的矫正算法,
2.3 基于直线探测的矫正算法
Python 使用Opencv实现直线检测和圆检测
2.4 最小外接矩形
opencv学习之路(26)、轮廓查找与绘制(五)——最小外接矩形