CTC(connectionist temporal classification)算法讲解

最新推荐文章于 2025-02-06 09:17:20 发布

憨憨coding

最新推荐文章于 2025-02-06 09:17:20 发布

阅读量1.2k

点赞数 1

分类专栏：深度学习 asr 文章标签：算法语音识别深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45019478/article/details/120579642

版权

深度学习同时被 2 个专栏收录

21 篇文章

订阅专栏

1 篇文章

订阅专栏

Temporal Classification是给定输入序列 $X=\left[x_{1}, x_{2}, \ldots, x_{T}\right]$ 以及对应的标签数据 $Y=\left[y_{1}, y_{2}, \ldots, y_{U}\right]$ ,例如语音识别中的音频文件和文本文件，我们的工作是找到 $X$ 到 $Y$ 的一个映射，这种对时序数据进行分类的算法叫做Temporal Classification。

CTC(connectionist temporal classification)是计算一种损失值，即最大化多种可能路径的概率和（最小化其负对数）。主要的优点是可以对没有对齐的数据进行自动对齐，主要用在没有事先对齐的序列化数据训练上。比如语音识别、ocr识别等等。

理解CTC可以分为两个阶段，首先是正向计算阶段（即给定 $X$ 和 $Y$ 如何计算对齐概率的含参表达式），其次是反向传播阶段（即训练过程的优化推导）。

具体过程可以参考白话CTC(connectionist temporal classification)算法讲解。

其他参考文章：
详解CTC
CTC原理

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。