论文阅读-Self-Supervised Video Forensics by Audio-Visual Anomaly Detection-音视频异常检测

一、论文信息

论文名称:Self-Supervised Video Forensics by Audio-Visual Anomaly Detection

作者单位:

 Github: https://cfeng16.github.io/ audio-visual-forensics.

二、动机与创新

动机:

被操纵的视频通常包含视觉和音频信号之间的微妙不一致,并且很难收集捕获所有可能操作的大型带标签的数据集。为检测被操纵的视频,本文作者提出了检测同步特征的异常。

创新:

  • 提出一种通过异常检测识别被操纵视频的方法,训练自回归生成模型来标记概率很低的视频。

  • 仅使用真实的未标记数据训练模型,以了解音视频是如何共现的,测试时,模型标记的低概率视频即为假视频。

  • 测试时的测试集可以为不同的说话人。(以前的方法的测试集都是在训练集基础上做一些数据增强得到)

三、方法

问题定义:异常检测,寻找视频中视觉和音频信号之间的不一致性。

具体采用基于异常检测的方法对视听示例分布进行建模。

同步特征提取过程如 (a) 所示,首先从视听同步的网络中提取特征:视频帧与音频之间的延迟帧数、每帧的延迟分布、来自视听子网的特征激活;(b)训练了一个自回归Transformer模型,将概率分配给

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值