论文笔记 AISTATS 2020|Rep the Set: Neural Networks for Learning Set Representations

hlee-top

已于 2022-03-30 23:44:22 修改

阅读量582

点赞数

分类专栏： NLP 论文文章标签：自然语言处理深度学习文档理解

于 2022-01-13 21:23:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/o11oo11o/article/details/122475510

版权

NLP 同时被 2 个专栏收录

125 篇文章 14 订阅

订阅专栏

125 篇文章 12 订阅

订阅专栏

文章目录

1 简介

论文题目：Rep the Set: Neural Networks for Learning Set Representations
论文来源：AISTATS 2020
论文链接：https://arxiv.org/pdf/1904.01962.pdf
代码链接：https://github.com/giannisnik/repset

1.1 创新

提出一个新的结构学习集合的表示，同时提出一个简化的变体降低复杂度，将模型用于大规模数据集。

2 背景知识

二分图匹配问题即选取一个子图，每个结点最多出现在一条边中，该问题的最优解可以解释为两个节点集 $V_1$ 和 $V_2$ 之间的相似性。Hungarian Algorithm可参考链接
在这里插入图片描述

3 方法

在这里插入图片描述
模型的整体框架如上图，主要分为下面几个部分：

排列不变层：使用二分匹配算法计算集合X和隐藏集合H之间的对于关系，选择最佳的匹配(一个X集合的元素对应一个H集合的元素)，公式如下(第一列)，其中 $f(v_i,u_j)=ReLU(v_i^Tu_j)$ 。
分类：给定隐藏集合为 $Y_1,Y_2,...,Y_m$ ，为m个不同的二分匹配问题，最终得到m维向量x，然后进行分类，公式如下(第二列)。

为了降低计算复杂度，提出一个简化的约束，如果 $|X|\geq|Y|$ ,公式如下，否则替换第一个约束为 $\sum_{j=1}^{|Y|}z_{ij}\leq1,{\forall}i \in\{1,...,|X|\}$

4 实验

分别在文本分类和图分类两种任务上进行实验。

4.1 文本分类

文本分类的实验结果如下图,评测指标为错误率：
在这里插入图片描述
同时通过下列实验发现隐藏集的元素可能与不同类别的主题相关。

4.2 图分类

文本分类的实验结果如下图：
在这里插入图片描述

4.3 运行时间分析

隐藏集合的大小m、维度、输入集合的大小和 $X_i|$ 的大小对运行时间的影响，如下图：
在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
论文笔记 AISTATS 2020|Rep the Set: Neural Networks for Learning Set Representations

文章目录1 简介1.1 创新2 方法3 实验3.1 文本分类3.2 图分类3.3 运行时间分析1 简介论文题目：Rep the Set: Neural Networks for Learning Set Representations论文来源：AISTATS 2020论文链接：https://arxiv.org/pdf/1904.01962.pdf代码链接：https://github.com/giannisnik/repset1.1 创新提出一个新的结构学习集合的表示，同时提出一个简化的变
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

hlee-top 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。