CVPR2018 CartoonGAN 解读

本文介绍了CVPR2018上关于图像风格迁移的CartoonGAN研究,该方法能将真实照片转换为不同风格的漫画,如新海诚和宫崎骏风格。CartoonGAN通过一种特别设计的GAN网络结构和损失函数实现,其创新点包括网络架构、损失函数和初始化训练策略。虽然作者未开源代码,但提供了预训练模型和第三方实现的测试代码。
摘要由CSDN通过智能技术生成

CartoonGAN前言

      本文是对CVPR2018的一篇关于图像风格迁移的论文解读,即CartoonGAN,它可以用真实景物的照片作为源图片,生成任意风格的漫画,如新海诚或者宫崎骏。有人说这不就是Photoshop的滤镜而已嘛,当然Photoshop也可以做到,但是只给你一分钟来产生上百张效果图,Photoshop能否做到?我自己也在复现,但发现真的很难调出效果好的模型,自己的实验还得继续。

作者调出的模型效果是非常不错的了,效果图如下:真实景物——新海诚风格——宫崎骏风格


论文链接:

http://203.187.160.133:9011/openaccess.thecvf.com/c3pr90ntc0td/content_cvpr_2018/papers/Chen_CartoonGAN_Generative_Adversarial_CVPR_2018_paper.pdf

作者未开源代码,只给出了四个训练好的模型(宫崎骏、细田守、今敏和新海诚风格),作者用torch进行实验,模型下载链接:

http://cg.cs.tsinghua.edu.cn/people/~Yongjin/CartoonGAN-Models.rar

于是Github有人写了test代码用以上四个模型来前向测试图像,以下用Pytorch写的test代码还不错:

https://github.com/Yijunmaverick/CartoonGAN-Test-Pytorch-Torch

大家可以自己看论文,下载模型,找一些真实场景图试试速度和效果。


CartoonGAN理论解读

CartoonGAN其实就是一个用于非成对image训练的GAN,可以说是单向的CycleGAN罢了,创新点就三点:

1、作者自己设计的GAN网络架构,包括生成网络G和判别网络D,都比较直观基础,如下图:

  • 7
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 18
    评论
CVPR2018首次引入了一个名为ClipQ(Clip Quality)的评价指标,用于衡量图像检索的质量。传统的图像检索任务通常使用精确率(Precision)和召回率(Recall)作为评估指标,但这两个指标无法完全反映出图像检索结果的质量。 ClipQ主要关注图像检索的相关性和质量。相关性衡量了检索结果与查询的相关程度,质量则表示结果图像与查询图像的视觉质量。传统的评价指标没有考虑到结果图像的质量因素,因此引入ClipQ指标,它综合考虑了图像的相关性和质量,能够更加客观地评估图像检索任务的效果。 ClipQ的计算方法主要依赖于两个因素:应答质量和应答分布。应答质量是通过计算两个图像之间的相似度来衡量的,相似度越高,应答质量越好。应答分布则是通过衡量相似图像在结果集合中的分布情况来计算的,分布越均匀表示应答品质越好。 通过结合应答质量和应答分布,ClipQ可以量化图像检索结果的质量。它能够在保证结果相关性的同时,进一步提高结果图像的质量,从而使得图像检索结果更加准确和精细。 总之,CVPR2018引入的ClipQ评价指标为图像检索任务提供了一种全新的评估方式。它综合考虑了图像的相关性和质量两个因素,可以更加客观地评估图像检索结果的好坏。ClipQ的引入将有助于推动图像检索领域的发展,提高图像检索任务的效果。
评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值