损失函数------CTCLoss

最新推荐文章于 2024-04-23 09:50:44 发布

小飞龙程序员

最新推荐文章于 2024-04-23 09:50:44 发布

阅读量2.1k

点赞数 2

分类专栏：目标检测文章标签：语音识别人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_47405013/article/details/127060215

版权

目标检测专栏收录该内容

40 篇文章 1 订阅 ¥119.90 ¥99.00

订阅专栏

超级会员免费看

CTCLoss

在语音识别中，我们的数据集是音频文件和其对应的文本，不幸的是，音频文件和文本很难再单词的单位上对齐。除了语言识别，在OCR，机器翻译中，都存在类似的Sequence to Sequence结构，同样也需要在预处理操作时进行对齐，但是这种对齐有时候是非常困难的。如果不使用对齐而直接训练模型时，由于人的语速的不同，或者字符间距离的不同，导致模型很难收敛。

CTC(Connectionist Temporal Classification)是一种避开输入与输出手动对齐的一种方式，是非常适合语音识别或者OCR这种应用的。

在这里插入图片描述

总结：CTC是计算一种损失值，主要的优点是可以对没有对齐的数据进行自动对齐。主要用在没有事先对齐的序列化数据训练上。比如语音识别、ocr识别等等。

小飞龙程序员

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
损失函数------CTCLoss

CTCLOSS
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小飞龙程序员 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。