基于度量学习的开放领域关系抽取

最新推荐文章于 2023-01-10 15:57:14 发布

weixin_42001089

最新推荐文章于 2023-01-10 15:57:14 发布

阅读量500

点赞数

文章标签：学习深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42001089/article/details/125111750

版权

前言

开放领域关系抽取（OpenRE）是一个比较常见的任务，其主要是从开放域的语料中抽取关系，目前大多数方法都没有充分的利用好手头已有的宝贵标注语料，今天介绍的这篇paper就提出了一个框架简称MORE，来解决这一问题，一起来看看吧～

论文链接：https://arxiv.org/pdf/2206.00289.pdf

方法

总体框架如下：

Neural Encoders

该模块是用来表征关系的，即把关系映射为一个embedding，当然了这里有很多方法，作者主要创新点也不是在这里，具体的作者使用了两种网络CNN和BERT，其中BERT就是多加了几个标识符如下：

然后concatenate [E1start], [E2start]处的embedding来表征关系

Ranked List Loss

这里是作者的创新点，不像以往的triplet loss、N-pair等度量学习的loss，作者这里用了Ranked List Loss，因为前者都是point-based 或者成对pair-based，而后者想做set-based级别的，具体的计算方式如下：

这里的r就是一个句子的关系表征，B可以理解为一个batch，当选取了一个句子即ri，那当前这个这个batch的样本与其的欧式距离为dij，这里把所有的样本分为两类，一类是positive一类是negative，其实就是和ri是相同标签就是positive，不同的就是negative，当是positive时，yij=1，否则是0。

为了更好的理解上述公式的实际作用，作者给了一张图：

对于那些位于αP外的positive点会被拉近和Anchor(ri)的距离，对于那些位于αN内的negative点会被拉远和Anchor(ri)的距离。

为了更加具体说明，这里将αP和αN公式拆开便是：

λ是一个平滑系数，实验中作者设置了为0.5。

当给定一个anchor时，在batch内会发现大量的negative样本点，这里作者做了一个归一化，首先是定义了一个权重

其中Tn是一个温度系数，比如当Tn=0时，那所有样本都是被同等对待，当Tn为正无穷时那基本上只关注最难的样本，所以最后套入公式(3)后便可得到

Virtua ladversarial training

为了使得训练的模型更有健壮性，作者使用了对抗学习进行训练，这里就不多讲了，是很常见的对抗方法，说白了就是对embedding进行扰动，感兴趣的小伙伴可以看笔者之前写过的一篇，里面也给出了具体实现的逻辑代码：

bert 对抗训练实现代码 - 知乎前沿对抗训练是魔改训练方式的一种，凡事对抗一下，说不定可以提高性能，建议都试一试，网上关于对抗训练的代码已经有很多啦，笔者这里简单汇总一些，供快速应用到自己的代码中，看效果，下面的代码包括FGSM,PGD.…https://zhuanlan.zhihu.com/p/422169401

实验

作者这里在两个数据集上做的实验：FewRel和NYT+FB，实验结果如下：

同时还给了在FewRel上的可视化结果：

总结

不知道大家看到作者paper中提到的Ranked List Loss有没有想到交叉熵以及svm中公式，在一定程度上是很像的，总之吧这个Ranked List Loss就是全文的创新点，别的基本上都很常规，大家感兴趣的话可以在自己领域试试吧。

关注

欢迎关注，下期再见啦~

欢迎关注笔者微信公众号：

github:

Mryangkaitong · GitHubhttps://github.com/Mryangkaitong

知乎：

小小梦想 - 知乎

weixin_42001089

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
基于度量学习的开放领域关系抽取

开放关系抽取
复制链接

扫一扫

weixin_42001089 CSDN认证博客专家 CSDN认证企业博客

码龄6年

212: 原创

2万+: 周排名

3396: 总排名

114万+: 访问

: 等级

7738: 积分

1661: 粉丝

1212: 获赞

592: 评论

4696: 收藏

私信

关注

分类专栏

调研 16篇
计算机基础 2篇
后台 1篇
html 1篇
chm 1篇
docker
打包
人工智能机器学习 48篇
skia 7篇
skia中文乱码
神经网络 10篇
github 2篇
Linux 4篇
线程 1篇
强化学习 4篇
spark 5篇
caffe
大数据 9篇
算法 56篇
python 13篇
java 1篇

最新评论

LightGBM源码阅读+理论分析（处理特征类别，缺省值的实现细节）
fangfang_plus: 请教下，如果是样本加权的话，对分裂节点有影响吗，样本加权作用在什么地方哈
如何自动筛选高质量的指令微调数据喂给大模型？
HHYY_7: 博主您好请问下那个MoDS算法我理解是在一个sft数据集上筛选高质量的数据集，筛选之后的数据集是之前数据集的子集，是不是就是说这个子集做sft之后的效果比原数据集好是吗
如何自动筛选高质量的指令微调数据喂给大模型？
紧警谨: IFD分子分母公式都漏了负号
扩散模型代码剖析
LeafMorning: 你好，想知道跑一个DDPM，图像256×256，t选择300。会占用多少显存？
机器学习实践流程（随机森林+LSTM实践）
m0_61745813: 您好，请问这个是在做关于汽车的故障检测么？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。