总结
目前主流的语音识别方法大多基于深度神经网络,这些方法大体分为两类:
一类是采用一定的神经网络取代传统语音识别方法中的个别模块,如特征提取、声学模型或语言模型等;另一类是基于神经网络实习端到端的语音识别。
展望
未来语音识别领域的研究方向可大致归纳如下:
(1)模型压缩与加速;
(2)数据迁移。在面对小样本数据或复杂问题时,迁移学习是一种有效的方式;
(3)多模态数据融合。对于一些复杂的语音场景,可以利用语音信号和其他信号进行融合,以提高语音识别性能;
(4)多技术融合。当前大多数语音识别算法只关注识别文字内容的正确性,然而许多智能语音交互的应用还未涉及到语义的理解。因此,将语音识别技术结合其他技术也是未来研究方向之一。