OCR
gukedream
人不能像走兽那样活着,应该追求知识和美德。
展开
-
CTC损失函数及其实现[1]
CTC损失函数及其实现[1]简介原理实现参考本文主要讲解了CTC损失函数的主要原理以及介绍了目前该损失函数的各种实现.简介显示中许多序列学习任务需要从含噪声,并且未分割的输入数据中预测出标签序列. 例如,语音识别,需要将声学信号转录成单词。RNNs似乎是一种适合这种任务的强大的序列学习器,但是,由于需要预分割的训练数据,以及需要后处理,将RNNs的输出转换为标签序列,使得该方法的应用受到限制...原创 2019-01-18 14:05:21 · 5877 阅读 · 0 评论 -
CTC损失函数及其实现[2]
最近用tensorflow写了个OCR的程序,在实现的过程中,发现自己还是跳了不少坑,在这里做一个记录,便于以后回忆。主要的内容有lstm+ctc具体的输入输出,以及TF中的CTC和百度开源的warpCTC在具体使用中的区别。正文输入输出因为我最后要最小化的目标函数就是ctc_loss,所以下面就从如何构造输入输出说起。tf.nn.ctc_loss先从TF自带的tf.nn.ct...转载 2019-01-18 14:36:08 · 3780 阅读 · 0 评论 -
Keras 函数[TimeDistributed]理解
这个函数刚接触时不太好理解,其实结合几个例子来理解就容易多了.例1:Keras 官网文档关于该函数的例子,该文档说:This wrapper applies a layer to every temporal slice of an input.The input should be at least 3D, and the dimension of index one will...原创 2019-01-18 14:59:26 · 6525 阅读 · 11 评论 -
[ECCV2018] 端到端的弯曲文本检测与识别
前言:这篇文章是第一个做弯曲文本的端到端检测+识别。 传统的方法将文字检测和文字识别分为两个分开的部分,即输入一张图,先进行文字检测,检测出文字的位置,再进行文字识别,即对检测出的文字抠出来并送入识别网络。这样一方面比较费时间,第二没有共享检测和识别的特征。 一 什么是端到端检测识别?即只需要一个网络,输入一张图片,同时输出检测和识别的结果,相比传统先检测再识别的好处在于...转载 2019-01-18 18:50:13 · 3428 阅读 · 1 评论