【Paper】CTC Introduce

CTC(Connectionist Temporal Classification)是一种用于序列问题的算法,常见于语音识别和手写识别。它允许输入和输出序列长度不匹配,解决了对齐问题,且仅支持单调对齐。CTC通过损失函数优化概率分布,并在推断时寻找最可能的输出。该算法已在TensorFlow、PyTorch等框架中得到应用,但其对齐限制在某些任务中可能成为限制因素。
摘要由CSDN通过智能技术生成

Connectionist Temporal Classification, an algorithm used to train deep neural networks in speech recognition, handwriting recognition and other sequence problems.

1. Problem

  • don’t know the characters in the transcript align to the audio when having a dataset of audio clips and corresponding transcripts.
  • people’s rates of speech vary.
  • hand-align takes lots of time.
  • Speech recognition, handwriting recognition from images, sequences of pen strokes, action labelling in videos.

2. Question Define

when mapping input seq

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

路途…

点滴记录

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值