ASR论文阅读
文章平均质量分 93
cxxx17
为什么可乐一定要加冰
展开
-
【Pre-train】SpeechT5
speecht5原创 2022-10-17 19:23:39 · 2202 阅读 · 0 评论 -
【E2E ASR】Spike-Triggered Non-Autoregressive Transformer for End-to-End Speech Recognition
Spike-Triggered Non-Autoregressive Transformer forEnd-to-End Speech Recognition原创 2021-02-17 18:21:56 · 916 阅读 · 5 评论 -
【E2E ASR】Triggered Attention for End-to-End Speech Recognition
同时应用CTC对齐能力以及Attention的建模能力,提出了Trigger Attention(TA),应用CTC-based分类器的后验概率,控制送入attention-based decoder的hidden states个数,能够实现可控的延时,远低于soft attention的延时。Triggered AttentionTA结构包括encoder和TA decoder,如下图所示。encoderencoder的作用是将输入的音频特征X转化成长度为T的encoder state 序列H:原创 2021-02-16 14:40:10 · 784 阅读 · 0 评论