[FUNIT] Few-Shot Unsupervised Image-to-Image Translation

最新推荐文章于 2023-03-06 16:43:12 发布

emergency_rose

最新推荐文章于 2023-03-06 16:43:12 发布

阅读量435

点赞数

分类专栏： paper阅读笔记文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_30618203/article/details/123262436

版权

paper阅读笔记专栏收录该内容

50 篇文章 0 订阅

订阅专栏

1、目的

无监督图像转换：source类 -> target类；

其中target类的样本很少，只在test时用到；

训练source类 -> 多个another类，其中another类的样本也较少；==> 通用的外观提取模型

2、原理/基础

1）人看到新物体（target class），可以基于以往的知识（trained model），脑补出新物体的不同姿势（generated picture）

2）图像之间存在部分共享的潜在空间

3、网络设计

1）条件图像生成器G（少样本图像转换器）

输入：一组内容图像 + 一组K类图像，每次随机取source类

输出：，其中外表和类中的一张图接近，但内容和相似

a）内容编码器：卷积 / 残差模块；提取class-invariant隐式表达，决定local structure；内容图像-> 隐码

b）类编码器：卷积 / 不同样本的平均操作；提取class-specific隐式表达，决定global look；K类图像 -> 中间隐码 -> element-wise平均后的最终隐码

c）解码器：AdaIN残差模块/上卷积层；样本激活 -> 0均值单位方差 -> 通过得到的仿射变换

2）多任务对抗判别器D

同时解决多个对抗分类任务，每个任务是二分类任务

4、目标函数

1）：GAN loss

D的上标表示计算相应类的二元loss

2）：内容图像重建loss

3）：特征匹配loss

其中，是判别器倒数第二层的输出

5、结论

1）训练类别数 ↑，目标类别图像数目 ↑，图像转化能力 ↑

2）理论基础：

a）内容编码器可以学到不随类别而改变的隐码

b）类编码器可以学到class-specific隐码

c）类编码器可以推广到新类别

3）新类在视觉上和训练用的source类具有相关性，如果差距过大，则FUNIT无法成功转换

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[FUNIT] Few-Shot Unsupervised Image-to-Image Translation

1、目的无监督图像转换：source类 -> target类；其中target类的样本很少，只在test时用到；训练source类 -> 多个another类，其中another类的样本也较少；==> 通用的外观提取模型2、原理/基础1）人看到新物体（target class），可以基于以往的知识（trained model），脑补出新物体的不同姿势（generated picture）...
复制链接

扫一扫

专栏目录

博客等级

码龄9年

109
原创

175
点赞

213
收藏

135
粉丝

关注

私信

热门文章

分类专栏

linux 12篇
windows 2篇
计算机 2篇
pytorch & tf & conda 8篇
工具 10篇
医学图像 8篇
python 4篇
算法 5篇
学习 1篇
paper阅读笔记 50篇
知识总结 7篇

最新评论

[DALL·E 2] Hierarchical Text-Conditional Image Generation with CLIP Latents
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619081027。
[ERFNet] Efficient Residual Factorized ConvNet for Real-time Semantic Segmentation
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。
Attention Is All You Need
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
[Faster R-CNN] Towards Real-Time Object Detection with Region Proposal Networks
CSDN-Ada助手: opencv 库原来就是视觉库，现在也算人工智能库，你觉的核心原因是什么？
[RCNN] Rich feature hierarchies for accurate object detection and semantic segmentation
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。