端到端语音识别
• Espnet: https://github.com/espnet/espnet • 实现了主流的端到端语音识别方法
• Speech-Transformer、LAS、CTC、RNN-T
• 一个小缺点:代码量已经越来越多...
• 实践:有GPU机器的话,可以跑一下egs下面的aishell1/2
• Speech Transformer: https://github.com/kaituoxu/Speech-Transformer
• Listen, Attend and Spell: https://github.com/kaituoxu/Listen-Attend-Spell