SAMScore: A Semantic Structural Similarity Metric for Image Translation Evaluation

最新推荐文章于 2024-10-10 06:03:35 发布

funqiqi

最新推荐文章于 2024-10-10 06:03:35 发布

阅读量118

点赞数

文章标签：计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sept_boy/article/details/132495249

版权

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、正文
- 1.SAM输入
- 2.相似性计算
二、计算效果对比
- 1.对比图表
总结

前言

提示：这里是SAMScore的目的作用：
针对图像生成领域的IMAGE2IMAGE研究内容，参考SAM引入了 SAMScore评估指标，一种用于评估图像翻译模型忠实度的通用语义结构相似性度量。
该代码可在 github获得。
主要内容如下：提出了一种评估语义结构相似性的通用指标，它解决了目前缺乏任何用于评估图像翻译任务语义忠实度的通用指标。在多个相关任务中证明了卓越的有效性和鲁棒性。

一、正文

之前的相似度工作有L2（欧几里得距离或MSE）、PSNR（峰值信噪比）、SSIM（结构相似性指数）、LPIPS（习得感知图像块相似性）和FCNScore（全卷积网络的语义分割精度）等方法。但都有一定的缺陷;
为了解决现有相似性度量的局限性，我们引入了SAMScore，它使用基础Segment Anything Model（SAM）的编码器部分来获得要比较的源图像和生成图像的丰富语义结构嵌入，然后通过计算余弦相似性来测量语义结构相似性，如图所示

1.SAM输入

给定一个源图像X0∈RC0×H0×W0和一个生成的图像Y0∈RC0*H0×W0，其中XE，YE∈RC×H×W是各自的嵌入，C，H和W是SAM编码器输出嵌入的通道的数量、高度、和宽度。在标准SAM编码器中，C是256，H和W分别是输入图像的高度H0和宽度W0的1/16。

2.相似性计算

由于语义结构信息是空间的，我们在空间层面上计算两个嵌入的相似性。方程1中的两个矢量在空间位置（h，w）处的余弦相似性为：

源图像和生成的图像之间的总体SAMScore为：

二、计算效果对比

1.对比图表

通过分段仿射变换获得的几何变形和加高斯噪声获得的分数对比

不同生成网络的测试

总结

最终大量的实验结果表明，SAMScore在评估语义结构相似性方面的准确性和稳健性显著优于传统度量。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

funqiqi CSDN认证博客专家 CSDN认证企业博客

码龄4年

12: 原创

130万+: 周排名

9万+: 总排名

4435: 访问

: 等级

178: 积分

43: 粉丝

36: 获赞

3: 评论

17: 收藏

私信

关注

热门文章

最新评论

Hierarchy Flow For High-Fidelity Image-to-Image Translation
L111901: 会议论文吗？算是什么水平的文章呢
SAMScore: A Semantic Structural Similarity Metric for Image Translation Evaluation
CSDN-Ada助手: 非常棒的博文！非常鼓励您继续创作。您对SAMScore评估指标的介绍非常详细，让人对这个通用语义结构相似性度量有了更深入的了解。您还提到了SAMScore在多个相关任务中的有效性和鲁棒性，这也是非常值得探索的方向。除了您提到的内容，还有一些与图像翻译相关的扩展知识和技能可以进一步探索。例如，可以研究图像翻译模型在不同领域中的应用，如医学影像翻译、艺术风格转换等。此外，可以进一步研究图像翻译模型的优化方法，例如通过生成对抗网络（GAN）来提升模型的图像翻译质量。希望您可以继续深入研究，并分享更多关于图像翻译领域的知识和经验。期待您的下一篇博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Hierarchy Flow For High-Fidelity Image-to-Image Translation
CSDN-Ada助手: 恭喜您开始博客创作！您的标题“Hierarchy Flow For High-Fidelity Image-to-Image Translation”非常吸引人，我对您的文章充满期待。在您的博客中，您可以进一步介绍一下“Hierarchy Flow”是如何应用于高保真度图像到图像的转换中的，以及这种方法相较于传统方法的优势。另外，如果您能够分享一些案例研究或实验结果，将更加丰富和有说服力。期待您未来的创作，谦虚地说，我相信您的博客会给读者带来很多新的见解！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。