ctc(Connectionist Temporal Classification) 学习

        CTC实际上解决了一个问题,狭义的讲,怎么确定一个语音识别网络输出的音素串是否对应一个单词。这个在利用损失函数进行优化的时候是必要的。

        一个单词的说法是很多的,有的部分发音长,有的部分发音短,因此一个单词的音素序列是很多的,不确定的,不可能直接用枚举的方式判断音素串是否对应一个单词。       

        CTC对序列整体进行建模,计算一个音素序列对应当前单词的概率。

        以heeϵlϵlloo 为例,判断heeϵlϵlloo音素序列是hello的概率。考虑一个整体比较麻烦,可以考虑把一个序列拆分成一个一个基本单元来分析。可以考虑用动态规划的方法。这里用递归的思路来分析。

        首先用P(heeϵlϵlloo|hello)表示heeϵlϵlloo对应hello的概率,考虑到连续音素可以匹配一个字符,P(heeϵlϵlloo)可以拆分成P(hellϵlϵllo|hello)P(o|o)+P(hellϵlϵllo|hell)P(o|o),然后P(hellϵlϵllo|hello)又可以拆分P(hellϵlϵll|hello)P(o|o)+P(hellϵlϵll|hell)P(o|o),然后不断拆分下去。最后会拆分成每个输出的音素的对应某个字符的概率。某个音素是某个字符的概率就是NN输出的softmax概率。

        
https://distill.pub/2017/ctc/icon-default.png?t=N7T8https://distill.pub/2017/ctc/

https://zhuanlan.zhihu.com/p/40170325icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/40170325连接时序分类 Connectionist Temporal Classification (CTC)_connectionist temporal classification-CSDN博客文章浏览阅读1.6k次,点赞12次,收藏11次。CTC全称Connectionist temporal classification,是一种常用在语音识别、文本识别等领域的算法,用来解决输入和输出序列长度不一、无法对齐的问题。在CRNN中,它实际上就是模型对应的损失函数(CTC loss)。_connectionist temporal classificationhttps://blog.csdn.net/m0_64768308/article/details/136494825华为开发者论坛icon-default.png?t=N7T8https://developer.huawei.com/consumer/cn/forum/topic/0201784250928720072CTC(Connectionist Temporal Classification)介绍_connectionist temporal classification (ctc)-CSDN博客文章浏览阅读1.7k次。CTC解决什么问题CTC,Connectionist Temporal Classification,用来解决输入序列和输出序列难以一一对应的问题。举例来说,在语音识别中,我们希望音频中的音素和翻译后的字符可以一一对应,这是训练时一个很天然的想法。但是要对齐是一件很困难的事,如下图所示(图源见参考资料[1]),有人说话块,有人说话慢,每个人说话快慢不同,不可能手动地对音素和字符对齐,这样太......_connectionist temporal classification (ctc)https://blog.csdn.net/weixin_36670529/article/details/102885071        Graves A, Fernández S, Gomez F, et al. Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks[C]//Proceedings of the 23rd international conference on Machine learning. 2006: 369-376.

 

  • 10
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值