语音方向论文阅读

1.Wav-BERT: Cooperative Acoustic and Linguistic Representation Learning for Low-Resource Speech Recognition

摘要

 模型结构

实验结果

BABEL

 

Aishell-1

 

 结论

利用BERT预训练模型来做语音识别,引入嵌入注意模块将声学信息融入到bert,促进表征学习

2.SIMPLIFIED SELF-ATTENTION FOR TRANSFORMER-BASED END-TO-END SPEECH RECOGNITION

摘要

模型结构

 

 实验结果

 结论

只是简单的Transformer中的全连接层进行替换成DFSMN或者去掉,没有去探究注意力的优化,实验结果也没有表现特别好!!!

3.Improving Streaming Transformer Based ASR Under a Framework of Self-supervised Learning

摘要

模型结构

实验结果

 

 结论

引入了多阶段学习,使用无监督学习以及知识蒸馏,无很大的创新点

 4.HEAD-SYNCHRONOUS DECODING FOR TRANSFORMER-BASED STREAMING ASR

 摘要

提出头同步的DACS(解码端自适应计算步骤)算法,

 算法步骤

 实验结果

结论

针对DACS算法提出HS-DACS算法,在流式结果对比上有所提升

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值