![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
图像转换
文章平均质量分 67
pip2pix, pix2pixHD, 老照片修复
飞越太平洋.
这个作者很懒,什么都没留下…
展开
-
图像评价常用指标(PSNR、SSIM、LPIPS 、IS、FID、Precision、Recall)
图像评价常用指标(PSNR、SSIM、FID、Recall)原创 2022-10-24 09:50:49 · 6608 阅读 · 0 评论 -
【多样化图像转换】2、You Only Need Adversarial Supervision for Semantic Image Synthesis(OASIS)代码
【多样化图像转换】2、You Only Need Adversarial Supervision for Semantic Image Synthesis(OASIS)代码原创 2022-09-16 09:20:54 · 840 阅读 · 0 评论 -
【多样化图像转换】1、You Only Need Adversarial Supervision for Semantic Image Synthesis(OASIS)论文
【多样化图像转换】You Only Need Adversarial Supervision for Semantic Image Synthesis(OASIS)原创 2022-09-14 21:08:37 · 981 阅读 · 1 评论 -
StarGAN v2: Diverse Image Synthesis for Multiple Domains (多域多样性图像合成)
StarGAN v2: Diverse Image Synthesis for Multiple Domains (多域多样性图像合成)原创 2022-09-13 10:41:49 · 2436 阅读 · 6 评论 -
PS选中部分区域调整透明度
1、选中分区2、按下ctrl+J复制新建图层1。3、载入选区。在图层面板,按住Ctrl键单击图层1的这个小框而不是文字载入选区4、在图层面板,点击图层0。按下delete键删除选区。5、选中图层1,点击不透明度。6、存储存储为PNG会保留透明图层,也就是当两个图片叠加在一起时会出现透明的效果存储为JPG不会这样ps怎么调整部分区域的透明度? ps选择区域变透明的技巧 - html中文网...原创 2022-05-03 13:59:40 · 7963 阅读 · 0 评论 -
【Paper】StyTr2: Image Style Transfer with Transformers
CVPR 2022|快手联合中科院自动化所提出基于Transformer的图像风格化方法 论文链接:https://arxiv.org/abs/2105.14576 代码地址:https://github.com/diyiiyiii/StyTR-2 目前主流的的风格化方法一般利用卷积神经网络学习风格和内容表示。由于卷积运算的感受野有限,只有卷积网络比较深,才能捕获图片的长程依赖关系。但是,网络深度的增加会导致图片特征分辨率降低和细节的丢失。细节的缺失体现在风格化结果中就是会...原创 2022-04-08 17:34:08 · 5362 阅读 · 11 评论 -
(SRNTT)Image Super-Resolution by Neural Texture Transfer
总结一波:与TTSR有很多相似之处,SRNTT可以看成是TTSR的前身,其中除了网络设计不同外,损失函数SRNTT比TTSR多了一个纹理损失。思考:是否可以用CharbonnierLoss来替换重建损失?题目:Image Super-Resolution by Neural Texture Transfer代码:https://github.com/ZZUTK/SRNTT1. 简介本文是Adobe发表在CVPR2019的基于参考图像的图像超分辨率重建论文,本文借鉴图像风格化 (im.原创 2022-03-04 16:58:50 · 2590 阅读 · 0 评论 -
二值化图像是什么?图像如何二值化?
图像二值化是什么?最简单的图像分割方法是二值化(Binarization)。图像二值化( Image Binarization)就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程。二值图像每个像素只有两种取值:要么纯黑,要么纯白。进行二值化的方式?其中最常用的就是采用阈值法(Thresholding)进行二值化,(根据阈值选取方式的不同,可以分为全局阈值和局部阈值)全局阈值的缺陷?在生产线环境下,光照是已知的,常常会设定一个固定的数字来作为全局阈值,在室外或..转载 2022-03-01 11:02:23 · 16250 阅读 · 5 评论 -
U-GAT-IT整体流程分析
生成器整体结构:CAM整体结构:对于本文的应用,CAM 可以得到判断图像是否为 fake 的 heatmap,作为 Loss 计算的指导AdaLIN分析 :论文阅读 | U-GAT-IT - 知乎原创 2022-02-27 21:43:54 · 2503 阅读 · 1 评论 -
U-GAT-IT中的一些细节以及变量含义
1、局部鉴别器(disL)与全局鉴别器(disG)self.disGA = Discriminator(input_nc=3, ndf=self.args.ch, n_layers=self.args.n_global_dis, with_sn=self.args.sn, use_cam_attention=self.args.cam_D_attention).to(self.args.device)self.disGB = Discriminator(input_nc=3, ndf=self.a.原创 2021-12-26 19:14:18 · 5905 阅读 · 0 评论 -
直方图匹配(histogram matching):使两幅影像的色调保持一致
概念:直方图匹配:将一张图片的直方图匹配到目标图上,使两张图的视觉感觉接近直方图匹配又称为直方图规定化,是指将一幅图像的直方图变成规定形状的直方图而进行的图像增强方法。即将某幅影像或某一区域的直方图匹配到另一幅影像上。使两幅影像的色调保持一致。可以在单波段影像直方图之间进行匹配,也可以对多波段影像进行同时匹配。两幅图像比对前,通常要使其直方图形式一致。基本介绍当一幅图像被描述为直方图后,所有的空间信息都丢失了。直方图描述了每个灰度级具有的像素个数,但无法为这些像素在图像中的位置提供...原创 2021-12-23 15:31:51 · 12683 阅读 · 0 评论 -
U-GAT-IT 论文阅读
摘要提出了两点:We propose a novel method for unsupervised image-to-image translation, which incorporates a new attention module and a new learnable normalization function in an end-to-end manner.与以往工作的不同:Unlike previous attention-based method which cannot h.原创 2021-12-23 21:02:18 · 5802 阅读 · 0 评论 -
cycleGAN的改进文章(CyCADA + U-GAT-IT)
1、为了用GTA游戏场景生成街景图片,用于扩展训练集,论文CYCADA提出了自己的Semantic Consistency Loss,取得了很好的效果。论文地址:https://arxiv.org/abs/1711.03213代码地址:https://github.com/jhoffman/cycada_release2、论文UGATIT则提出了使用“热图引导注意力机制”和“AdaLIN归一化”方法增强了CycleGAN头像风格迁移任务的效果。论文地址:https://arxiv.org/ab原创 2021-12-22 16:42:36 · 12274 阅读 · 0 评论 -
图像着色(image colorization)基本了解
目录2.1 Plain Networks2.1.1 Deep Colorization2.1.2 Colorful Colorization2.1.3 Deep Depth Colorization2.2 User-guided networks2.2.1 Scribbler2.2.2 Real-Time User-Guided Colorization2.2.3 Interactive Deep Colorization2.2.4 Anime Line Art Colo原创 2021-11-09 09:40:40 · 13828 阅读 · 2 评论 -
PS将一张图片裁剪/划分为多块
将一个图片裁剪为平均的几张图片1、首先在电脑是将Photoshop软件打开,接下来就是在PS软件中打开需要分割的图片。2、接下来按“Ctrl+j”快捷键,把刚刚的图片复制一层。3、然后在左边工具栏中选择箭头所指处的“切片工具”。4、然后在图片上点击鼠标右键,在列表中选择“划分切片”,在对话框中选择需要划分的数目,点击“确定”即可。5、接下来在上方工具栏中选择“文件”-“导出”-“存储为web所用格式”,然后选择红色箭头所指处的“存储”即可。...原创 2021-10-05 17:00:46 · 29785 阅读 · 0 评论 -
python处理一个文件夹下的所有文件并保存在新的文件夹
python处理一个文件夹下的所有文件并保存在新的文件夹原创 2021-09-30 09:41:11 · 20581 阅读 · 1 评论 -
三通道的黑白图(不同于单通道的普通的黑白图片)
有的图片是黑白色的,但不是单通道,而是三通道的,是因为 每个像素点的3个值相同(其中要注意三个通道的像素点的值一样,要是三个通道当前值的平均值(代码上的temp)而不是某个通道上的值)。也就是说:三通道图可以是黑白图(24bit),但单通道图只能是黑白图(8bit)我们可以使用三通道的黑白图做风格转换其中代码如下:def image2label(path, size_): w = size_[0] h = size_[1] label_im = cv2....原创 2021-09-30 09:28:08 · 18836 阅读 · 0 评论 -
pix2pix损失函数理解(精)
下面分为生成器和鉴别器的损失函数分别进行说明:1.生成器(generator)的损失函数:生成器的损失函数由对抗损失和像素损失构成。 def backward_G(self): """Calculate GAN and L1 loss for the generator""" # 1.对抗损失,G(A) should fake the discriminator fake_AB = torch.cat((self.r...原创 2021-09-29 14:58:43 · 20704 阅读 · 1 评论 -
cycleGAN的整体架构+损失函数理解
CycleGAN算法笔记_AI之路-CSDN博客_cyclegan结合下面的图来理解原创 2021-09-24 15:13:56 · 19771 阅读 · 0 评论 -
TTSR再次理解,主要是针对Texture Transformer TT的全部过程的一个梳理
Proposed Method因此,文章基于注意力机制,提出了一个纹理 Transformer 网络(TTSR),最大程度地利用了参考图像的信息,它可以有效地搜索与迁移高分辨率的纹理特征到低分辨率图像中,解决纹理模糊和纹理失真的问题。网络的主要两个部分:纹理转换器 (Texture Transformer )TT :把Ref图像中的HR纹理迁移到LR图像中 跨尺度特征集成模块(Cross-Scale Feature Integration) CSFI:融合不同尺度的纹理特征,提高SR图像质量1.原创 2021-08-03 17:19:00 · 18304 阅读 · 0 评论 -
深入理解——亚像素 / sub-pixel、亚像素卷积
目录1.1 亚像素理解1.2 何谓亚像素?1.3 何谓亚像素精度?摘要:2 图像处理中的sub-pixel是什么意思?3 PixelShuffle(像素重组)1.1 亚像素理解在相机成像的过程中,获得的图像数据是将图像进行了离散化的处理,由于感光元件本身的能力限制,到成像面上每个像素只代表附近的颜色。例如两个感官原件上的像素之间有4.5um的间距,宏观上它们是连在一起的,微观上它们之间还有无数微小的东西存在,这些存在于两个实际物理像素之间的像素,就被称为“亚像素”。亚像素原创 2021-06-23 20:39:05 · 28001 阅读 · 5 评论 -
(TTSR)Learning Texture Transformer Network for Image Super-Resolution
万物皆可 Transformer:基于纹理 Transformer 模型的图像超分辨率技术Transformer 结构被广泛应用于自然语言处理任务,取得了显著的成果,然而其在图像生成领域中鲜有应用。针对于图像超分辨率问题,微软亚洲研究院创新性地提出了一种基于纹理 Transformer 模型的图像超分辩率方法(TTSR),取得了显著的效果。该模型可以有效地搜索与迁移高清的纹理信息,最大程度地利用了参考图像的信息,并正确地将高清纹理迁移到生成的超分辨率结果当中,解决纹理模糊和纹理失真的问题。纹理...原创 2021-06-22 20:04:06 · 18228 阅读 · 1 评论 -
CVPR 2020丨图像超清化+老照片修复技术,拯救你所有的模糊、破损照片
编者按:也许你曾从橱柜里翻出家人们压箱底的老照片,而它们已经泛黄发脆,甚至有些褪色;也许你在拍照时不慎手抖,只好把糊成一片的照片都丢进“最近删除”。而微软亚洲研究院在计算机视觉顶会 CVPR 2020 发表的两项黑科技——基于纹理 Transformer 模型的图像超分辨率技术,和以三元域图像翻译为思路的老照片修复技术,将能让这些照片奇迹般地恢复如初。同时,图像超分别率技术将于近期上线 PowerPoint,未来也将有更多图像修复技术集成进微软 Office 产品中。从古老的胶片照相机到今天的数码时代,原创 2021-06-19 10:56:16 · 19578 阅读 · 0 评论 -
【训练过程】2) Train the VAEs of domain A and domain B respectively(分别训练域A和域B的VAE)
Downloading: "https://download.pytorch.org/models/vgg19-dcbb9e9d.pth" to C:\Users\admin/.cache\torch\hub\checkpoints\vgg19-dcbb9e9d.pth原创 2021-06-18 20:39:37 · 16613 阅读 · 0 评论 -
【训练过程】1) Create Training File(创建训练文件)
Put the folders of VOC dataset(clean images是原始的干净图像(VOC)), collected old photos (e.g., Real_L_old and Real_RGB_old(real_l_old是只有灰度(亮度)的照片集,real_rgb_old是彩色照片集)) into one shared folder. Thencd Global/data/python Create_Bigfile.pyNote: Remember to modify原创 2021-06-18 20:04:08 · 16796 阅读 · 6 评论 -
【Bringing Old Photos Back to Life】How to train?如何训练
1) Create Training FilePut the folders of VOC dataset, collected old photos (e.g., Real_L_old and Real_RGB_old) into one shared folder. Thencd Global/data/python Create_Bigfile.pyNote: Remember to modify the code based on your own environment.2)原创 2021-06-18 15:11:23 · 16718 阅读 · 0 评论 -
【Bringing Old Photos Back to Life】Mapping(mapping_net)映射网络
1.With the emergence of deep learning, one can address a variety of low-level image restoration problems [5, 6, 7, 8, 9, 10, 11, 12] by exploiting the powerful representation capability of convolutional neural networks, i.e., learning the mapping for a spe原创 2021-06-17 10:27:44 · 16589 阅读 · 0 评论 -
【Bringing Old Photos Back to Life】nonlocal block(非局部块)==>针对结构化缺陷,利用全局上下文来恢复潜在特征
1.Besides, to address multiple degradations mixed in one old photo, we design a global branch with a partial nonlocal block targeting to the structured defects, such as scratches and dust spots, and a local branch targeting to the unstructured defects, suc原创 2021-06-16 19:44:46 · 17013 阅读 · 0 评论 -
让老照片重现光彩(一):Bringing Old Photos Back to Life
作者开创性地使用了两个变分自动编码器(VAEs),分别将旧照片、干净照片映射到两个不同的潜码空间。这里,r 是真实的旧照片;(x, y) 是通过数据合成产生的配对数据集,y 是干净照片集,x 是由 y 退化而得到的破损照片集。将数据集 { r }、{ x }、{ y } 分别映射到潜码空间 Zr 、Zx、Zy 。{ r }、{ x } 都是破损照片集,可以强化某种约束使 Zr ≈ Zx (通过联合训练的对抗判别器 adversarial discriminator 来闭合其域间隔)。利用合成的数据对..原创 2021-05-29 20:27:58 · 16892 阅读 · 0 评论 -
pix2pixHD模型设计详情
目录pix2pixHD提高真实性和分辨率GeneratorDiscriminator损失函数改进输入学习实例级别的特征编码pix2pixHD tookPyramidMethods:First output low-resolution pictures. Use the previously output low-resolution picture as input to another network, and then generate a high...原创 2021-06-06 14:37:11 · 18043 阅读 · 0 评论 -
LSGANs : Least Squares GAN(最小二乘GAN)--解决标准GAN生成的图片质量不高以及训练过程不稳定问题
LSGANs基本思想LSGANs的英文全称是Least Squares GANs。这篇文章针对的是标准GAN生成的图片质量不高以及训练过程不稳定这两个缺陷进行改进。改进方法就是将GAN的目标函数由交叉熵损失换成最小二乘损失,而且这一个改变同时解决了两个缺陷。为什么最小二乘损失可以提高生成图片质量?我们知道,GANs包含两个部分:判别器和生成器。判别器用于判断一张图片是来自真实数据还是生成器,要尽可能地给出准确判断;生成器用于生成图片,并且生成的图片要尽可能地混淆判别器。本文作者认为以交叉熵作为原创 2021-06-03 19:12:36 · 17847 阅读 · 1 评论 -
(论文pix2pixHD)High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs
Abstract Results:We present a new method for synthesizing high-resolution photo-realistic images from semantic label maps using conditional generative adversarial networks (conditional GANs). Aims:Conditional GANs have enabled a variety of applic...原创 2021-06-02 11:16:48 · 16768 阅读 · 0 评论 -
pix2pix 与 pix2pixHD的大致分析
图像翻译,指从一副图像到另一副图像的转换。可以类比机器翻译,一种语言转换为另一种语言。下图就是一些典型的图像翻译任务:比如语义分割图转换为真实街景图,灰色图转换为彩色图,白天转换为黑夜......本文主要介绍图像翻译的三个比较经典的模型pix2pix,pix2pixHD, vid2vid。pix2pix提出了一个统一的框架解决了各类图像翻译问题, pix2pixHD则在pix2pix的基础上,较好的解决了高分辨率图像转换(翻译)的问题, vid2vid则在pix2pixHD的基础上,较好的原创 2021-04-03 15:32:50 · 19128 阅读 · 0 评论 -
pix2pix, CycleGAN和pix2pixHD(没有公式,容易理解)
pix2pix:有条件地使用用户输入,它使用成对的数据(paired data)进行训练。 CycleGAN:使用不成对的数据(unpaired data)的就能训练。 pix2pixHD:生成高分辨率、高质量的图像。1.pix2pix2.cyclegGAN(使用不成对的数据)同时要保证原图与生成图片可以相互转换不丢失信息3.pix2pixHD先输出低分辨率的图片。 将之前输出的低分辨率图片作为另一个网络的输入,然后生成分辨率更高的图片。具体信息看原文:htt..原创 2021-04-22 15:14:12 · 16750 阅读 · 0 评论 -
pix2pix笔记(B站,更加清晰)
原创 2021-04-06 11:02:55 · 16470 阅读 · 0 评论 -
pix2pix算法笔记(精)
pix2pix是基于cGAN实现图像翻译,因为cGAN可以通过添加条件信息来指导图像生成,因此在图像翻译中就可以将输入图像作为条件,学习从输入图像到输出图像之间的映射,从而得到指定的输出图像。而其他基于GAN来做图像翻译的,因为GAN算法的生成器是基于一个随机噪声生成图像,难以控制输出,因此基本上都是通过其他约束条件来指导图像生成,而不是利用cGAN,这是pix2pix和其他基于GAN做图像翻译的差异。一.工作流程:pix2pix算法的示意图如图Figure2所示,在图中以基于图像边缘生成图像为例介原创 2021-04-04 09:46:12 · 20823 阅读 · 1 评论