HRDA-Net：面向真实场景的图像多篡改检测与定位算法

最新推荐文章于 2024-06-11 17:17:12 发布

米朵儿技术屋

最新推荐文章于 2024-06-11 17:17:12 发布

阅读量958

点赞数

CC 4.0 BY-SA版权

分类专栏：信息技术发展的研究与探讨专栏文章标签：算法深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_70923796/article/details/129104844

信息技术发展的研究与探讨专栏专栏收录该内容

67 篇文章 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

本文提出了HRDA-Net，一个端到端的高分辨率扩张卷积注意力网络，用于真实场景下图像的多篡改检测与定位。通过构建多篡改数据集MM Dataset，解决现有数据集的局限性。HRDA-Net利用TDDCA模块融合RGB和SRM特征，结合MDC模块实现多篡改任务。实验表明，HRDA-Net在多篡改检测与定位任务上表现出优越性能，并具有良好的稳健性。

摘要

针对主流篡改数据集单幅图像仅包含一类篡改操作，且对真实图像定位存在“伪影”问题，构建面向真实场景的多篡改数据集（MM Dataset），每幅篡改图像包含拼接和移除2种篡改操作。针对多篡改检测与定位任务，提出端到端的高分辨率扩张卷积注意力网络（HRDA-Net），利用自顶向下扩张卷积注意力（TDDCA）模块融合图像 RGB 域和 SRM 域特征。最后，采用混合扩张卷积模块（MDC）分别提取拼接、移除和篡改检测任务特征，实现篡改区域定位和篡改置信度预测。为提高网络训练效率，提出余弦相似度损失函数作为辅助损失。实验结果表明，在MM Dataset下，与主流语义分割方法相比，HRDA-Net具有较优的性能和较强的稳健性；在单篡改数据集CASIA和NIST下，与主流单篡改定位方法相比，HRDA-Net的F1和AUC分数均较优。

关键词： 深度学习 ; 多篡改检测与定位 ; 多篡改数据集 ; 余弦相似度损失函数

0 引言

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

米朵儿技术屋 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。