CIL: Contrastive Instance Learning Framework for Distantly Supervised Relation Extraction

最新推荐文章于 2023-05-26 17:13:22 发布

YingJingh

最新推荐文章于 2023-05-26 17:13:22 发布

阅读量698

点赞数 1

分类专栏：论文记录文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hekena/article/details/123881433

版权

论文记录专栏收录该内容

147 篇文章 9 订阅

订阅专栏

CIL: Contrastive Instance Learning Framework for Distantly Supervised Relation Extraction

领域：远程监督

MIL：multi instance learning（多实例学习）

核心：

认为之前在远程监督处理上，采用注意力机制等方法，会使得包内的信息损失，另外，无论一个bag包含多少个实例，在MIL中只能使用形成的bag-level表示进行进一步训练，这是非常低效的。因此，希望采用构建正例和负例样本，充分利用bag中的intsance的信息。

文章的出发点

：如何使初始 MIL 框架足够高效以利用所有实例，同时保持在 DS 数据噪声下获得准确模型的能力？
核心思想：共享相同关系三元组（即正对）的实例在语义空间中应该靠近，而具有不同关系三元组（即负对）的实例的表示应该远离

流程：

sentence encoder

（句子编码：【CLS】 t1 t2 t3 t4 【H-CLS】e1【H-SEP】t5 t6【T-CLS】e2 【T-SEP】t7 t8…）
包编码:采用软注意力机制得到对应的包的表示，训练目标是：在得到包表示的条件下，对应bag的relation label 的概率最大
在这里插入图片描述

对抗实例学习

正向实例的构建：
1是随机在包含s的bag中选择一个不是s的实例s’作为正实例
2以当前包含s的包的表示作为s的正实例
3.基于IF-IDF方式，对s做重建，插入、替换一些不重要的词（实体词不能变动）

（1.2的噪声比较大，依赖于包的质量，因此，认为3更佳）
负向实例的构建：
1、随机从t这个包里选择一个实例作为s的负例
2、使用Bt这个包的表示作为s的负例

训练目标：
在这里插入图片描述

预训练模型的训练

：
mask 机制
训练目标：Lm
总的训练目标：

在这里插入图片描述

实验数据：

手工和DS构建两种（数据集质量会影响模型效果，模型在不同数据集上表现好，才是真的好）
在这里插入图片描述

在related work中，提到了一些有代表的工作，但还不是很了解。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
CIL: Contrastive Instance Learning Framework for Distantly Supervised Relation Extraction

CIL: Contrastive Instance Learning Framework for Distantly Supervised Relation Extraction领域：远程监督MIL：multi instance learning（多实例学习）核心：认为之前在远程监督处理上，采用注意力机制等方法，会使得包内的信息损失，另外，无论一个bag包含多少个实例，在MIL中只能使用形成的bag-level表示进行进一步训练，这是非常低效的。因此，希望采用构建正例和负例样本，充分利用bag中的i
复制链接

扫一扫

专栏目录

博客等级

码龄4年

343
原创

211
点赞

679
收藏

1974
粉丝

关注

私信

热门文章

分类专栏

最新评论

word中避免无引用源的方法
hx0520: 摸索了一下mac系统锁定域,按command+fn+f11
PDF相关的处理操作
haakaa: csdn这段确实好用
EMNLP-21-Enhanced Language Representation with Label Knowledge for Span Extraction-NER-融入label knowl
小阳不一样666666: 请问作者你复现成功了嘛？我按照论文设置超参数，但是对于ace2005效果只有0.84没有论文的0.86，这是我设置的情况：--task_type=ner --task_save_name=ner111 --data_dir=./data/ace2005 --data_name=ace2005 --model_name_or_path=D:/YangCode/data/bert-large-cased --model_name=SERS --output_dir=./outmodel --result_dir=./result --do_lower_case=False --first_label_file=./data/ace2005/processed/label_map.json --train_set=./data/ace2005/processed/train.json --dev_set=./data/ace2005/processed/dev.json --test_set=./data/ace2005/processed/test.json --label_str_file=./data/ace2005/processed/label_annotation.txt --overwrite_output_dir=True --exist_nested=True --do_train=True --is_chinese=False --val_step=20 --use_attn=True --seed=42 --max_seq_length=128 --dropout_rate=0.1 --learning_rate=3e-5 --task_layer_lr=2 --num_train_epochs=20能帮忙看看问题所在嘛？
EMNLP-21-Enhanced Language Representation with Label Knowledge for Span Extraction-NER-融入label knowl
YingJingh: 那得看你的环境和论文中的环境一不一致
EMNLP-21-Enhanced Language Representation with Label Knowledge for Span Extraction-NER-融入label knowl
小阳不一样666666: 你好，请问这个代码你运行起来了嘛？能咨询你一下嘛？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

YingJingh 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。