ICLR 2020 | 图表示的预训练策略

最新推荐文章于 2024-07-29 00:17:18 发布

PaperWeekly

最新推荐文章于 2024-07-29 00:17:18 发布

阅读量474

点赞数

文章标签：机器学习人工智能自然语言处理深度学习大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/112255602

版权

本文关注于图表示模型的预训练方法，特别是在生物化学领域的应用，如分子和蛋白质结构。研究发现，节点级别和整图级别的预训练策略分开进行可能效果有限，提出了结合节点和整图的预训练方案。论文中探讨了节点级的上下文预测和属性遮掩，以及整图级性质预测，强调了预训练任务与下游任务的相关性选择的重要性。

摘要由CSDN通过智能技术生成

©PaperWeekly 原创 · 作者｜张笑

单位｜成都数联铭品

研究方向｜图表示和知识挖掘

背景

在图像和自然语言处理领域，预训练和微调的模式取得较大成功，图表示模型的预训练方法还在起步阶段，其不仅需要增加前置的任务，同时还需要专业知识选择出与下游任务相关性强的样本和任务，再进行训练。否则很有可能出现反效果（类比于原始 BERT，NSP 任务实质上效果有限）。

动机

这篇论文考察的是生物化学领域，再具体点是分子结构和蛋白质结构。分子、蛋白质较容易获得独立的结构，同时它们都是限个小元素的排列组合而成，并且每个子结构的研究也比较丰富，比如元素周期表，化学键，蛋白质的多肽结构，子结构的初级功能也有一定的研究（分子的性质，合成分子性质的假设实验，蛋白质控制细胞凋亡和增殖等），有较丰富的整图级的预训练任务。

需要说明的是，本文的样本是多个独立的小结构，不同于社交网络或者用户-商品这类图谱（连通网络非常大）。所以对后者，仍然需要重新设计抽取小结构以及设置小结构任务的方案。针对这篇文章，下文将 graph-level 称为整图级。

本文主要工作在设计节点级别的预训练方案，补充整图级别预训练策略；实验发现，两类策略分开进行预训练，对下游任务的提升有限，甚至有时会起到反效果。

直观来说，作者想让节点的编码可以根据类别分开（类比原子的种类），同时不同功能的整图编码（整图中各节点编码的聚合 pooling）也能够分开，即达到上图

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。