了解《语音识别》必看的6篇论文【附打包下载地址】

本文推荐了6篇关于语音识别的论文,重点关注流式解码和非递归网络在该领域的应用。推荐理由包括单调注意力机制、CTC尖峰切分、信息累积思路、逐块解码方法等,旨在帮助读者深入理解并应用于实际的语音识别任务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文推荐

“ 《SFFAI 78期-语音识别专题》来自中科院自动化研究所的田正坤同学推荐的文章主要关注于语音识别领域,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。

关注文章公众号

回复"SFFAI78"获取本主题精选论文

01

推荐理由:本文介绍单调注意力机制,通过限制注意力机制的单调性,实现了语音识别的流式解码。

—— 田正坤

02

推荐理由:本文的思路与百度SMLTA相似,利用CTC的尖峰对编码序列进行切分,在切分块上计算注意力机制来实现流式解码。

—— 田正坤

03

推荐理由:本文是信息累积的思路。通过判断是否达到触发的阈值,如果达到阈值则在当前位置进行切分,如果没有达到阈值,则记录当前位置所包含的信息量,然后跳转到下一时刻并重复上述计算。

—— 田正坤

04

推荐理由:本文通过逐块解码的方式来实现流式解码,将编码序列切分为等长的块,在块内进行注意力的计算,如果预测得到空格标记则表示当前块解码完成,并跳转到下一个块,重复上述计算直到最后一个块解码结束。

—— 田正坤

05

推荐理由:本文最先将非递归网络引入语音识别任务,并提出了使用两种非递归网络的解码思路。

—— 田正坤

06

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值