图像任务
OCR任务
图像分类
目标检测
图像分割
图像增强
视频任务
正文: OCR
学习OCR
参考资料:
OCR文字识别实战
TextDetection文本检测数据集汇总
参考博客:
典型应用
- 车牌识别,路牌识别
- 拍照搜题,拍照检查
- 自然场景文字识别
- 内容审核
- 数码管数字识别方法整理
常见挑战
- 版式复杂
- 扭曲形变
- 手写涂改,笔记
- 不均匀光照,反光,运动模糊
比赛
- ICDAR
经典OCR方法
单字符识别方法
- 模式匹配
- 特征提取+分类器
- CNN识别
序列识别方法
- CRNN
- RARE
- attention_ocr
tessernet
论文:
源码:
特点:
文字检测模型 Part (think about CV中的目标检测)
faster-RCNN/YOLO/SSD
CTPN (2016): Connectionist Text Proposal Network
论文: Detecting Text in Natural Image with Connectionist Text Proposal Network@2016
源码:
参考博客:
OCR技术(CTPN,SegLink,EAST文本检测)
特点:
- connect proposals
- Side-refinement
- 检测小框代替直接检测大文本框
- 对于非水平的文本的检测效果并不好
EAST 2017 : An Efficient and Accurate Scene Text Detector
论文: EAST: An Efficient and Accurate Scene Text Detector@20170710
源码: argman/EAST --tensorflow /flask
参考博客:
OCR文本检测模型—EAST
PVANET算法笔记
- less channels with more layers
- 论文:PVANET: Deep but Lightweight Neural Networks for
Real-time Object Detection
@20160930
特点:
- 提出了基于two-stage的文本检测方法:全卷积网络(FCN)和非极大值抑制(NMS)
- 在检测长文本时的效果比较差,这主要是由于网络的感受野不够大;
- 在检测曲线文本时,效果不是很理想
PSENET:progressive scale expansion algorithm
论文: Shape Robust Text Detection with Progressive Scale Expansion Network
源码:
tensorflow_PSENet
参考博客:
psenet解读
PSENet原理介绍
特点:
- psenet作为一种基于分割的方法
- psenet的检测速度稍慢
DB: Real-time Scene Text Detection with Differentiable Binarization
论文: Real-time Scene Text Detection with Differentiable Binarization
源码:
参考博客:
《DB:Real-time Scene Text Detection with Differentiable Binarization》论文笔记
特点:
文字识别
CRNN == CNN +RNN +CTC
论文: An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition @20150721
源码: meijieru/crnn.pytorch
特点:
- 每次都要计算概率,速度慢
- end to end识别
参考博客
CRNN算法详解
基于attention文字识别
attention_ocr