1.背景知识
CTC的全称是Connectionist Temporal Classfication,是Graves等人提出来的一种时序分类算法,重点解决的问题是输入数据与给定标签的对齐问题。
论文链接: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6306&rep=rep1&type=pdf
在一些序列任务,比如ocr、asr、手写识别中,在训练模型之前,需要对训练样本进行分割对齐,然后识别每个小块的类别,这对数据的标注提出了较大的挑战,获得这样的数据集也是代价较大,而CTC算法就是解决这样的序列分类任务。
2. 下面将以一个语音识别问题来对ctc算法进行讲解