ocr
文章平均质量分 64
_小马奔腾
这个作者很懒,什么都没留下…
展开
-
LSTM 与 CTC loss (以及DP、HMM)
最近在OCR识别,用到了CTC loss。只能说爱你不容易啊。1、CTC解决什么问题? [1] Sequence to sequence learning [2] Unsegmented real-valued input stream (一般用于语音与光符字体识别) 因为如果在ocr或者语音方面,寻求分割的方式解决识别问题,那是难上加难。 例如:分割难...原创 2018-02-27 16:01:18 · 11182 阅读 · 23 评论 -
OCR 总结
最近3个月一直不做人脸相关任务了,现在做OCR 还是老规矩,先放上OCR的最前沿的论文。1、state-of-art进展https://github.com/hs105/Deep-Learning-for-OCRhttps://github.com/chongyangtao/Awesome-Scene-Text-Recognitionhttp://mclab.eic.h原创 2017-10-19 17:13:06 · 2918 阅读 · 0 评论 -
强大的imageMagick实战
用了差不多一年的imageMagick,它提升了我的工作效率,本文主要总结一下这里的奇技淫巧一、图像基本操作1.1、图像resizeconvert -resize 50% input.jpg output.jpg # 缩放到原来的一半convert -resize 100X100 input.jpg output.jpg # 缩放到100*100# - - - 批处理 - - - ...原创 2018-12-04 20:25:41 · 2037 阅读 · 2 评论 -
Page dewarping (OCR之图像去扭曲)
在OCR中,存在着两个预处理难题【1】图像角度预判 【2】图像去除扭曲,去除扭曲主要包含两个方面:透视,畸变由于paper对这方面的论述几乎找不到,尤其是ICCV,NIP,CVPR、ECCV等鲜有新论文本文主要记录一下各种传统算法以及深度学习算法在图像扭曲上的尝试,持续更新...原创 2019-08-09 10:14:42 · 4074 阅读 · 0 评论