文章基本信息:题目,作者,作者机构,发表刊物或会议,年份,期刊会议等级(CCF)
题目,Multi-mode Transformer Transducer with Stochastic Future Context
作者,Kwangyoun Kim1, Felix Wu1, Prashant Sridhar1, Kyu J. Han1, Shinji Watanabe2
作者机构,1ASAPP , USA 2Carnegie Mellon University, USA
发表刊物或会议,INTERSPEECH
年份,2021
期刊会议等级(CCF):C类
本文背景及提出的问题
背景:
- ASR
- Sequence Transducers
- Dual-mode ASR
- Transformer Transducer
提出问题:
自动语音识别(ASR)模型在较多的周围语音信息作为上下文呈现时,出错率会更低。但较多的未来上下文将导致更高的延迟。
为了适应不同的延迟需求,人们必须存储多个模型,并在约束