Efficient Representation Learning via Adaptive Context Pooling

最新推荐文章于 2024-10-05 11:27:00 发布

西西弗的小蚂蚁

最新推荐文章于 2024-10-05 11:27:00 发布

阅读量207

点赞数

分类专栏：时间序列数据表征学习文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zj_18706809267/article/details/125684986

版权

时间序列数据表征学习专栏收录该内容

20 篇文章 5 订阅

订阅专栏

自我注意机制通过在所有输入标记之间使用成对注意来建模长期上下文。在这样做的过程中，他们假设单个标记(例如，文本字符或图像像素)定义了固定的注意力粒度，这可能不是在更高级别上对复杂依赖关系建模的最佳选择。在本文中，我们提出了ContextPool，通过调整每个标记的注意粒度来解决这个问题。受ConvNets成功结合池化来捕获远程依赖的启发，我们学会了在给定的注意层中计算注意之前，为每个令牌池化邻近的特性。池权和支持大小是自适应确定的，允许池特性以不同的规模编码有意义的上下文。我们表明，ContextPool使注意力模型更具表现力，通常用更少的层实现强大的性能，从而显著降低成本。实验验证，当我们的ContextPool模块插入变压器模型时，在几种语言和图像基准上使用较少的计算，匹配或超过了最先进的性能，在学习上下文大小或稀疏注意模式方面优于最近的工作，也适用于ConvNets的高效特征学习。

背景：

西西弗的小蚂蚁

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。