序列模型之CTC算法

CTC(Connectionist Temporal Classification)是一种解决输入数据与给定标签对齐问题的时序分类算法,常用于OCR、ASR等序列任务。在语音识别中,CTC通过定义操作去除无效字符和重复字符,解决不同发音形式的转换,并通过前后向算法训练模型,即使在没有逐帧标注的情况下也能进行训练。
摘要由CSDN通过智能技术生成

1.背景知识

      CTC的全称是Connectionist Temporal Classfication,是Graves等人提出来的一种时序分类算法,重点解决的问题是输入数据与给定标签的对齐问题

论文链接: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6306&rep=rep1&type=pdf

      在一些序列任务,比如ocr、asr、手写识别中,在训练模型之前,需要对训练样本进行分割对齐,然后识别每个小块的类别,这对数据的标注提出了较大的挑战,获得这样的数据集也是代价较大,而CTC算法就是解决这样的序列分类任务。

2. 下面将以一个语音识别问题来对ctc算法进行讲解

   

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值