【论文阅读】WWW 2022：Cross-modal Ambiguity Learning for Multimodal Fake News Detection

兴隆山的风

已于 2023-03-15 14:09:10 修改

阅读量1.1k

点赞数 2

分类专栏：论文阅读整理文章标签：论文阅读深度学习人工智能

于 2023-03-08 10:57:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51007786/article/details/129398772

版权

论文阅读整理专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Cross-modal Ambiguity Learning for Multimodal Fake News Detection

论文来源：WWW 2022
论文链接：https://dl.acm.org/doi/10.1145/3485447.3511968
数据集地址：待补充

Motivation

作者认为当单模态特征很明显时，多模态融合反而会降低性能，反之单一模态表现不够时，需要引入多模态特征。

另外，作者还认为模态间的gap会造成融合时的信息损失，因此通过将不同模态的特征映射到一个嵌入空间来对齐模态特征。

Method

在这里插入图片描述

文章提出的模型由这几个部分组成：

编码器
模态对齐模块
单一模态的信息估计
多模态融合
分类头

其中2，3，4是主要架构。

编码器

采用Bert和Resnet-34分别对文本和图片进行编码。

模态对其模块

通过设计一个辅助任务，对比学习不同模态间的相似度。具体来说，就是从原始数据集D中真实类别的新闻中构建一个辅助对比数据集D2：

来自同一条真实新闻的图片和文本，相似度为1(positive)
来自不同真实新闻的图片和文本，相似度为0(negative)

辅助任务损失函数

通过对比函数计算辅助任务的损失。

训练过程的顺序如下：
训练步骤

训练好的模块用于将不同模态特征映射到一个共享的空间。

模态信息估计

通过KL散度衡量单一模态之间的分布，个人理解是将分布近似认为是模态信息之中的偏差，偏差越小说明单一模态的信息越有用，多模态融合的特征分配的权重就会越小。

权重分配

多模态融合

感觉没什么好说的，就是注意力上变花样，排列组合一下诶。

在这里插入图片描述

分类头

输入的特征包括视觉模态、文本模态、融合模态，这三个特征通过信息估计的结果分配权重组合起来。

然后是MLP外面再套一个Softmax输出。

在这里插入图片描述

整个模型的损失包括了：分类损失、辅助任务的损失

Result

总的结果：
在这里插入图片描述

消融实验结果：

在这里插入图片描述

从上到下依次是：去掉对其模块、去掉信息估计、去掉模态融合

另外作者针对信息估计中使用不同函数、模态融合使用不同方式额外做了实验：

在这里插入图片描述

兴隆山的风

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
4
评论
【论文阅读】WWW 2022：Cross-modal Ambiguity Learning for Multimodal Fake News Detection

WWW2022 虚假新闻检测-多模态假新闻检测的跨模态歧义学习
复制链接

扫一扫

专栏目录

兴隆山的风 CSDN认证博客专家 CSDN认证企业博客

码龄4年

17: 原创

52万+: 周排名

92万+: 总排名

2万+: 访问

: 等级

202: 积分

290: 粉丝

18: 获赞

8: 评论

66: 收藏

私信

关注

热门文章

分类专栏

最新评论

【论文阅读】WWW 2022：Cross-modal Ambiguity Learning for Multimodal Fake News Detection
Fz....: 挺有意思的
【论文阅读】Improving Fake News Detection by Using an Entity-enhanced Framework to Fuse Diverse Multimodal
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】SIGIR 2021：Hierarchical Multi-modal Contextual Attention Network for Fake News Detection
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】WWW 2022：Cross-modal Ambiguity Learning for Multimodal Fake News Detection
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
leetcode239. 滑动窗口最大值
TTianbo123: 博主的技术面很广哦，而且都是干货文章，小菜鸟求带，可以加你微信随时和您交流吗，感谢

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。