语音识别的一些概念

最近发现台湾的陈老师的语音识别课程主页,里面有很多课程,现在把课程主页贴在这里,大家可以去看看。

主页:http://berlin.csie.ntnu.edu.tw/Courses/Speech%20Recognition/Speech%20Recognition_Main_2013F.htm

第一个概念是上次在一个群里有人问到的。就是上下文相关和上下文无关的音素。截个图大家看下就会明白吧。


解释下:

通常都是一个词,然后我们都把它对应成音素,最简单的就是单音素,不考虑上下文。当然这种带来的效果就不好。人们就想到用三音素来解决,得到的效果就好点。最后一个是因为在实际的计算中,我们为了减少计算量而做的一种聚类,把相同发音的音素都聚成一个类。


第二个概念是之前在深度学习的论文中经常出现的。是senone,就是我们之前说的聚类中的一个类。



先看到这几个概念。后面的有就再继续补充。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值