Depth-First Neural Architecture With Attentive Feature Fusion for Efficient Speaker Verification

masami麻酱

已于 2024-01-05 14:13:16 修改

阅读量422

点赞数 9

文章标签：人工智能深度学习机器学习

于 2024-01-03 22:21:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_80722985/article/details/135372937

版权

DF 设计背后的核心思想在于在保持网络复杂性的同时显着加深网络。

(a)~(d) 从 ResNet18 到 DF-ResNet56 的路线图。 (a) 原始 ResNet 中的瓶颈块。 (b) 用深度卷积代替标准卷积。 (c) 下移 32 个通道的 1 ×1 卷积，上移 128 个通道的 1x1 卷积。另外，将深度卷积的通道数从 32 更改为 128。 (d) 单独的下采样层放置在残差块之后。单独的 d.s.代表单独下采样。

深度卷积

参数量从普通卷积的3*3*3*5=135变成3*3*3+1*1*3*5=62

逐深度卷积：不同于原始卷积，深度卷积是一个卷积核负责一个通道，独立地在每个通道上进行空间卷积。因此，深度卷积的输出特征图数量等于输入特征图数量，无法进行有效的维度扩展。

逐点卷积：由于一个特征图仅被一个滤波器卷积，无法有效的利用不同通道在相同空间位置上的特征信息，由此加入了逐点卷积。点卷积主要是要1×1卷积构成，负责将深度卷积的输出按通道投影到一个新的特征图上。

第一步基本块换成瓶颈块（4*2*3-4*2*2=8）从resnet18--resnet26，所有指标全部变差。

第二步，深度卷积（32*128**2+3*3*158+128*128+128**2到32*128**2+3*3*32+32*32），三个指标都进行了下降。

第三步置换卷积层，参数显著下降，flop基本不变，error暂时升高

第四步，除了最后一个残差块之外，其他每个的输出都下采样一下，参数稍微上升，error重新降低。

第五步，三个指标的下降，为增加层数做好了准备。

(a)→(d) 从 ECAPA(C = 512) 到 DF-ECAPA52 的路线图。为了简单起见，图中忽略了 SE 块。 (a) ECAPA 中的原始 SE-Res2Block(C = 512)。 (b)将 3 × 3 扩张卷积替换为 5 × 5 标准卷积。 (c) 将通道数下采样一半。 (d) 将 DF-ECAPA244 中 SE-Res2Block 中前两层的通道数缩小一半。

第一步本来想用扩张卷积，这不会增加参数，但它牺牲了对复杂关系进行建模的能力。又由于更大的感受野可以通过简单地增加内核大小来实现。因此，决定删除扩张卷积并采用具有大内核尺寸的标准卷积。

关注

9
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
Depth-First Neural Architecture With Attentive Feature Fusion for Efficient Speaker Verification

(a)~(d) 从 ResNet18 到 DF-ResNet56 的路线图。(a) 原始 ResNet 中的瓶颈块。(b) 用深度卷积代替标准卷积。(c) 下移 32 个通道的 1 ×1 卷积，上移 128 个通道的 1x1 卷积。另外，将深度卷积的通道数从 32 更改为 128。(d) 单独的下采样层放置在残差块之后。单独的 d.s.代表单独下采样。
复制链接

扫一扫

masami麻酱 CSDN认证博客专家 CSDN认证企业博客

码龄1年

3: 原创

162万+: 周排名

24万+: 总排名

1220: 访问

: 等级

51: 积分

15: 粉丝

16: 获赞

2: 评论

19: 收藏

私信

关注

热门文章

最新评论

Depth-First Neural Architecture With Attentive Feature Fusion for Efficient Speaker Verification
CSDN-Ada助手: 恭喜您撰写了标题为“Depth-First Neural Architecture With Attentive Feature Fusion for Efficient Speaker Verification”的博客！您对深度优先神经架构与注意力特征融合在高效说话人验证中的应用进行了精彩的探讨。这篇博客充分展示了您在该领域的深入理解和研究能力。作为下一步的创作建议，我想提醒您在博客中加入更多实际案例或实验结果，这将使读者更好地理解您的观点，并更加深入地探索该领域的应用。此外，您可以考虑引用一些相关研究或观点，以拓宽读者的视野并加强您的论述。继续保持您的创作热情和努力，期待您未来更多精彩的博客内容！请谦虚地接受这些建议，因为我相信您会在未来的创作中不断进步和取得更大的成就。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Depth-First Neural Architecture With Attentive Feature Fusion for Efficient Speaker Verification
CSDN-Ada助手: 非常棒的博客！你的标题和摘要已经很好地概括了你的博文内容。我鼓励你继续创作，分享更多关于深度学习和神经网络的知识。除了你提到的ResNet和DF-ResNets，还有一些扩展的知识和技能可以与你的博文相关。例如，你可以探索更多的神经网络架构，如Inception、VGG和MobileNet，以及它们在不同任务上的应用。此外，你还可以了解更多关于特征融合的方法，如注意力机制、卷积操作和池化操作等。希望我的建议对你有所帮助，期待看到你更多精彩的博客！继续加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。