CTC(connectionist temporal classification)算法讲解

Temporal Classification是给定输入序列 X = [ x 1 , x 2 , … , x T ] X=\left[x_{1}, x_{2}, \ldots, x_{T}\right] X=[x1,x2,,xT]以及对应的标签数据 Y = [ y 1 , y 2 , … , y U ] Y=\left[y_{1}, y_{2}, \ldots, y_{U}\right] Y=[y1,y2,,yU] ,例如语音识别中的音频文件和文本文件,我们的工作是找到 X X X Y Y Y的一个映射,这种对时序数据进行分类的算法叫做Temporal Classification。

CTC(connectionist temporal classification)是计算一种损失值,即最大化多种可能路径的概率和(最小化其负对数)。主要的优点是可以对没有对齐的数据进行自动对齐,主要用在没有事先对齐的序列化数据训练上。比如语音识别、ocr识别等等。

理解CTC可以分为两个阶段,首先是正向计算阶段(即给定 X X X Y Y Y如何计算对齐概率的含参表达式),其次是反向传播阶段(即训练过程的优化推导)。

具体过程可以参考白话CTC(connectionist temporal classification)算法讲解

其他参考文章:
详解CTC
CTC原理

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值