Set Transformer: A Framework for Attention-based Permutation-Invariant Neural Networks

VERY_NPU

已于 2023-02-03 11:02:08 修改

阅读量582

点赞数

分类专栏：三维点云文章标签：人工智能深度学习

于 2023-02-03 10:51:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_27136953/article/details/128856603

版权

文献阅读笔记系列

一、题目：Set Transformer: A Framework for Attention-based Permutation-Invariant Neural Networks

这是一篇利用transformer的自注意力机制来处理无序的集合数据的一种编码解码结构。

二、提出问题

对于输入为集合数据的问题，深度模型需要满足两个条件：1）：对于输入数据中的任何排列方式，模型都可以保持一致的输出。2）：模型可以处理任意长度的集合数据（例如PointNet中的MLP在处理点云时所有点都共享权重，理论上可以处理任意数量的点，最后再通过均衡函数进行特征聚合）。
本文提出的模型也是按这两个条件所设计的。

三、创新点

1、基于注意力机制，本文提出了一种全新的用于处理集合数据的解码器和编码器结构。
2、利用诱导点方法将自注意力中的计算复杂度由平方转化为线性（对于输入集合中的实例数量来说）。

四、主要理论

本文主要设计了三种基于注意力的集合操作MAB，SAB， ISAB，如下图所示：
在这里插入图片描述
1、首先是注意力和多头注意力
单头注意力：
$Att\left( Q,K,V;w \right) =w\left( QK^T \right) V \\where\ Q\in \mathbb{R}^{n\times d_q},\ K\in \mathbb{R}^{n_v\times d_p},\ V\in \mathbb{R}^{n_v\times d_v},\ QK^T\in \mathbb{R}^{n\times n_v}$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Set Transformer: A Framework for Attention-based Permutation-Invariant Neural Networks

Set transformer
复制链接

扫一扫

专栏目录

VERY_NPU CSDN认证博客专家 CSDN认证企业博客

码龄9年

3: 原创

56万+: 周排名

130万+: 总排名

2706: 访问

: 等级

64: 积分

6: 粉丝

12: 获赞

23: 评论

26: 收藏

私信

关注

热门文章

分类专栏

三维点云 3篇

最新评论

PointNet的证明过程最全详解
红鲤鱼遇绿鲤鱼: 谢谢博主解答
PointNet的证明过程最全详解
VERY_NPU: 可以这么理解，你看到空间中的这些点，它们在三维空间难道就必须用三维描述嘛，其实三维点可以用二维的极坐标描述，当然也可以用四维、五维甚至更多，只不过这样描述的空间不是流性空间，它是有冗余的，所以这里的N，可以是很多可能
PointNet的证明过程最全详解
红鲤鱼遇绿鲤鱼: 博主您好，看了您的博文，受益匪浅。您在该层表示R代表一个实数空间，而且并非一个实数，但是在原论文中第4页公式(1)，h(x)表示的的映射是R^N——>R^K，如果按照您说的R表示的并非是一个实数，那这里的映射R^N表示的是什么呢？我的理解是点云中一个点的空间维度。
PointNet的证明过程最全详解
点云处理Zzz: 好的，谢谢解答，我再看看
PointNet的证明过程最全详解
VERY_NPU: 我觉得你那样理解不对，而且知乎那个作者也没有说多个点落在这个区间，Vk就>=1。此外我也不认同那个作者这样理解，如果x中的每一维映射为对应的hk后，按他所说每一维也都是0或者1，那么再经过max函数后，全局特征的每一维照样不是0就是1，本来是连续空间，现在变成0或1，这么大的信息损失使得后边根本无法做识别、检测等任务，所以我还是坚持我文章中的解释应该是正确的，你可以再看看。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。