《FL-MSRE: A Few-Shot Learning based Approach to Multimodal Social RelationExtraction》

知识点

  1. 了解few-shot learning: 理解1理解2
    在这里插入图片描述
  2. 欧式距离
    在这里插入图片描述

Contribution

  1. We present multimodal social relation datasets, which can facilitate future research on multimodal SRE. 提出一个新数据集
  2. To leverage both texts and face images, we propose a novel approach FL-MSRE for SRE。为了同时利用文本和人脸,提出一个新方法FL-MSRE来进行社交关系识别
  3. Extensive experiments demonstrate that FL-MSRE is effective in SRE from texts and face images。实验顶

数据集构建

  1. 因为为图片数据集补充文本很困难,因此考虑为文本数据集补充图片。
  2. 句子:提取至少提到两个人的句子,并至少两个人支持
  3. 图片:提取至少包含两个人的 image
  4. 只保留细粒度的关系。如 family(no),father(yes)
  5. 最后将数据集分为三部分:DRC-TF(15 rels),OM-TF(9 rels),FC-TF(24 rels)。
  6. Every social relation is supported by multiple triples; every triple is supported by multiple pairs of face images about the two entities in the triple as well as by multiple sentences mentioning both the entities.

Model

  1. N way (relations) K shot (tupels) setting 来预测另外的 N tuples on the same N social relations
  2. 网络结构,前面简单的多模态特征抽取和拼接(text 特征用 bert 提取,人脸用facenet,最后两特征 concanate。可能没抄别人,自己提的),后面用的别人的网络( prototypical network [Snell, Swersky, and Zemel 2017b)],代码都一模一样)。在这里插入图片描述
  3. Prototypical Network
    先计算关系 rm 的 prototype representation
    10.
    预测时,分别计算每个 query 和 rm 的欧式距离
    在这里插入图片描述

实验

  1. 只有一个对比方法 BERT;分别在三个数据集上;4种 N way K shot

github代码

  1. loss和accuracy的计算参考论文: 《FewRel 2.0: Towards More Challenging Few-Shot Relation Classification》,Prototypical Network代码和这篇论文的代码一模一样。主要在于理解NOTA
  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值