Connectionist Temporal Classification（CTC）——李宏毅人类语言处理学习笔记

我是小蔡呀～～～

已于 2022-12-22 00:52:34 修改

阅读量516

点赞数 1

分类专栏：李宏毅人类语言处理文章标签：学习深度学习人工智能

于 2022-12-03 21:33:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/overload_/article/details/128152588

版权

李宏毅人类语言处理专栏收录该内容

8 篇文章

订阅专栏

CTC

ctc可以做到online recognition，它只需要encoder，在进行语音辨识时，要选择一些可以支持online recognition的encoder，例如：单向RNN。
在这里插入图片描述
但是输入的x1——声音讯号特征，其frame很小，往往代表了少量信息甚至null，因此较难判断是哪个token，所以在ctc的token中引入了一个null。

输出中有一部分是null，但实际输出中不能有null，所以ctc会做一下后处理，即合并token，移除null。
在这里插入图片描述

怎么训练呢？

question:不知道正确的输出是什么，4个位置应该放什么。
在这里插入图片描述
自己制造合适的label，穷举所有的alignment。

来自博客添加链接描述
在这里插入图片描述

CTC存在的问题

假设前三个frame都是ccc，正常来说是最后输出的是c。但是第二个没识别成功认为它是null，那么前三个frame就是c null c，最后输出就是cc，就结巴了…，但是也没有这么糟糕，我们可以在encoder中做一些处理，比如已经输出c了我们则降低输出c的概率。
在这里插入图片描述

我是小蔡呀～～～

博客等级

码龄6年

44
原创

53
点赞

203
收藏

407
粉丝

关注

私信

热门文章

分类专栏

最新评论

【论文精度】ViT(AN IMAGE IS WORTH 16*16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE)
CSDN-Ada助手: 非常棒的分享！ViT这个模型确实在图像识别领域有很大的用途。希望你能继续分享更多的深度学习领域的技术和想法。如果你需要一个建议的话，我建议你可以写一篇关于“GPT-3”的博客，它是一款使用了自然语言处理和深度学习的神经网络模型，它的作用是生成人工智能的语言。它的开发公司Open AI宣称它是史上最强大的自然语言处理AI，这个话题非常有趣和有价值，期待你的分享！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
DenseNet与ResNet
小余要努力: 支持原创好文，望回关
【论文精度（李沐老师）】Generative Adversarial Nets
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/615017725。
【论文精读（李沐老师）】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN一周精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/614690782。
【论文精读（李沐老师）】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/614567934。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

我是小蔡呀～～～ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。