语音方向论文阅读

最新推荐文章于 2023-02-22 20:16:30 发布

尚歌

最新推荐文章于 2023-02-22 20:16:30 发布

阅读量468

点赞数

分类专栏： paper阅读语音识别文章标签：自然语言处理语音识别深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wudibaba21/article/details/120531902

版权

语音识别同时被 2 个专栏收录

33 篇文章 32 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

1.Wav-BERT: Cooperative Acoustic and Linguistic Representation Learning for Low-Resource Speech Recognition

摘要

模型结构

实验结果

BABEL

Aishell-1

结论

利用BERT预训练模型来做语音识别，引入嵌入注意模块将声学信息融入到bert，促进表征学习

2.SIMPLIFIED SELF-ATTENTION FOR TRANSFORMER-BASED END-TO-END SPEECH RECOGNITION

摘要

模型结构

实验结果

结论

只是简单的Transformer中的全连接层进行替换成DFSMN或者去掉,没有去探究注意力的优化，实验结果也没有表现特别好！！！

3.Improving Streaming Transformer Based ASR Under a Framework of Self-supervised Learning

摘要

模型结构

实验结果

结论

引入了多阶段学习，使用无监督学习以及知识蒸馏，无很大的创新点

4.HEAD-SYNCHRONOUS DECODING FOR TRANSFORMER-BASED STREAMING ASR

摘要

提出头同步的DACS（解码端自适应计算步骤）算法，

算法步骤

实验结果

结论

针对DACS算法提出HS-DACS算法，在流式结果对比上有所提升

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
语音方向论文阅读

1.Wav-BERT: Cooperative Acoustic and Linguistic Representation Learning for Low-Resource Speech Recognition摘要模型结构实验结果BABELAishell-1结论利用BERT预训练模型来做语音识别，引入嵌入注意模块将声学信息融入到bert，促进表征学习...
复制链接

扫一扫

专栏目录

尚歌 CSDN认证博客专家 CSDN认证企业博客

码龄7年

60: 原创

1万+: 周排名

207万+: 总排名

22万+: 访问

: 等级

1997: 积分

7409: 粉丝

181: 获赞

40: 评论

1254: 收藏

私信

关注

分类专栏

最新评论

音频预处理(数据增强方法总结)
Higer_Lin: 作者你好，我想在一段吃鸡边开枪边走路的音频单独对枪声和脚步声分别进行降低和增强音量处理再输出保存，请问能给些提示
音频预处理(数据增强方法总结)
weixin_42790222: 可以用 torch-audiomentations
音频预处理(数据增强方法总结)
追风筝的人5: 图的横纵坐标代表什么呀？
Python实现K-means聚类算法
Silhouette195: 博主，您好！请问怎么换为自己的数据集呢？
Word中如何加载EndNote
宇宙投递员: 我也是，想问如何解决了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。