attention 笔记

瑶光light

已于 2022-07-11 11:30:52 修改

阅读量664

点赞数

分类专栏： asr 文章标签：语音识别人工智能

于 2022-07-08 16:44:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39780859/article/details/125681538

版权

asr 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

https://www.pudn.com/news/62aaf72ca11cf7345fa716a7.html

论文1：
LOCAL INFORMATION MODELING WITH SELF-ATTENTION FOR
SPEAKER VERIFICATION
改进1：用local attention 取代全局attention，因为全局attention不能很好地捕捉局部信息，而说话人验证这种任务通常更关注相邻帧的信息。local attention的做法是对关注的帧（也即相邻帧）之外的帧全部抹零。这种硬截断的方法虽然有效，但不好实验出到底抹掉多少帧才是最适合的。因此作者假设随着距离远近，不同帧对当前帧的影响大体遵从一个高斯分布，这种称为软截断。工程上减少了试验次数，且效果优于硬截断。
改进2：卷积的局部建模能力是公认的。conformer也比传统的transformer效果更好。作者尝试将卷积层应用在self-attention的不同部位。1、让卷积层取代全连接层生成kqv。2、让卷积层取代feed forward层中的全连接层。最后实验出来取代feed forward效果较好。conformer的效果最差。

改进1和改进2结合起来效果最优。
缺点：作者并未探究参数量的影响

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。