《FL-MSRE: A Few-Shot Learning based Approach to Multimodal Social RelationExtraction》
先了解few-shot learning: 理解1,理解2
数据集构建
因为为图片数据集补充文本很困难,因此考虑为文本数据集补充图片。
句子:提取至少提到两个人的句子,并至少两个人支持
图片:提取至少包含两个人的image
只保留细粒度的关系。如family(no),father(yes)
最后将数据集分为三部分:DRC-TF(15 rels),OM-TF(9 rels),FC-TF(24 rels)。
Every social relation is supported by multiple tri
原创
2021-04-19 11:08:33 ·
773 阅读 ·
0 评论