图像处理
文章平均质量分 78
hn_lgc
这个作者很懒,什么都没留下…
展开
-
CNN一些小点
CNN一层中的一个通道矩阵叫做feature map,特征图。比如输入的灰度图像,有1个feature map, 变换到第二层有6个feature map。之所以叫feature map特征图,是因为一个特征图代表的是一个图像的特征,越到后面这个特征越抽象,越多,所以后面的特征图也就是通道数越多。然后特征图本身的大小减小了,也就是特征抽离出来了,没有那么多杂质了,也更抽象了,不需要那么多元素去描述它了。一个特征图使用一个卷积核进行卷积得到,卷积核是3维的,不要把它想成2维的,通道是第3维,也即大小是k原创 2020-10-10 00:14:56 · 141 阅读 · 0 评论 -
风格转换GAN-李宏毅课程笔记
风格转换不止能用在图像上,也可以用在语音、文字上。明星声音模拟,男声变女声之类的。特征向量应该是GAN中比较重要的一个东西,就是一副图像什么的,它具有的主要特征,就是更低维的向量,然后GAN利用这个低维向量做生成,生成的图像具有这些主要特征,但是在其它方面不一定一样。举例来说,比如条件GAN,特征向量制定了高铁,然后其余内容由GAN控制。风格转换这里,通过输入图像指定了部分主要特征,然后其余部分用GAN转换成另一个领域的。...原创 2020-10-06 05:41:37 · 675 阅读 · 0 评论 -
数字图像基础-几何变换
几何变换就是改变了像素的位置,它不改变像素的值。有一个点是图像绕任意一点旋转x度之后,效果是类似的,旋转之后平移就可以使图像重合。绕任意一个点缩放x倍之后,也是一样的。一般的变换使用矩阵乘法完成,(x,y,1)[三行三列的矩阵],怎样的矩阵相乘应该是可以做出x,y相关的任意线性变换。加入x2,y2,xy等的项,似乎就能做非线性变换了,不过应该不常用。几何变换之后要进行插值,尤其旋转,因为实际图像是离散的,不是连续的。如下图实际看上去就像图像中出现了毛刺、断裂。数字图像本身是高维信息,做各种原创 2020-10-05 04:26:28 · 279 阅读 · 1 评论 -
StackGAN笔记
Stack可译做堆叠,就是在GAN上面再放上一个GAN。作者讲述自己的解决思路,原来难以生成高分辨率的图像,他们分解了这个问题,把生成高分辨率图片这个任务分解成两个更为简单的任务。就是文中说的一个GAN生成大致的形状和颜色,第二个GAN生成细节和修正错误,这比直接一个GAN生成更加容易。这似乎研究中解决一些任务的一种常用的方法,以前看的一篇论文,图像修复的,先修复缺失的轮廓边缘,再填充颜色。比直接一次完成好。就是把一个任务分成可以区分的两个任务,分别加以处理。翻译:摘要:从文字描述中生成具有照片般真原创 2020-10-01 03:34:01 · 1102 阅读 · 0 评论 -
条件生成CGAN-李宏毅课程笔记
生成图片,图片属于高维空间,也就是高维空间的一个分布,生成图片就是拟合图片的分布函数,从中选取一个是图片概率最大的点。拟合分布用最大释然估计或者叫最小化KL散度这类的方法。成图片的研究最早在80年代就有人在做了,但是当时神经网络没这么流行,用高斯分布之类的来拟合分布,效果不好。如下图,GAN这里就是用NN构成的generator来生成一个数据分布,其概率密度为Pg,然后Pg与Pdata足够接近,基于NN的强大拟合能力,生成的图像就能足够逼真。...原创 2020-09-26 23:08:34 · 678 阅读 · 0 评论 -
反卷积公式的理解
卷积基础已知。定义i 输入尺寸o 输出尺寸p 填充paddings 步长,这里面似乎应该解释为放大倍数k 卷积核大小卷积操作尺寸计算公式为 o = (i +2p -k)/s +1反卷积的计算公式(1)如果 (i + 2p - k)%s= 0, 则关系为i= s(o-1)-2p+k,(2)如果(i + 2p -k)%s!=0, 则关系为i=s(o-1)-2p+k+ (o+2p-k)%s看了网上不少内容,介绍了很多反卷积的东西,但是没有解释这个公式的简单的理解算一下就知道,实际上式如其原创 2020-09-13 01:43:55 · 1974 阅读 · 1 评论 -
Python图片处理PIL简介
详见官方文档:http://effbot.org/imagingbook/基础:支持的格式:Mode #The mode of an image defines the type and depth of a pixel in the image. The current release supports the following standard modes:1 (1-bit pixels, black and white, stored with one pixel per byte)L原创 2020-09-04 23:56:05 · 356 阅读 · 0 评论 -
GAN 李宏毅 课程笔记(一)
Generator 不用想得太复杂,就是一个函数。函数的形式可以是NN。输入一个向量,这个向量可以看成一个控制向量,用向量中的元素表示生成对象的属性。生成对象可以是不同的东西,图片矩阵,文字序列都可以,需要具体控制。这可以弄出一个有趣的应用,通过改变输入向量,生成人脸渐变的中间图像。比如用向量中的第一个元素表示头发的长度,导数第二个表示头发的颜色。一样的,判别器也可以看成一个函数,可以是NN。它的输入是前面生成的对象,比如一张图片。输入是一个数字,就是生成对象的逼真程度,符合程度。GAN的原原创 2020-09-01 15:30:35 · 417 阅读 · 0 评论 -
图像处理基础-直方图均衡化,规定化,灰度级变换
像素的领域:在一定意义下与像素相邻的像素的集合,是一种空间关系。常用的是4领域还有符号N4§对角领域:8领域,显然,也即3*3领域像素邻接:空间上相邻,某种性质相似,比如灰度值比如指定灰度范围vq属于p像素的4领域且p属于v,则称p、q 4-邻接同样有8-邻接等连通性:p和q能通过相互邻接的点连接,陈p、q之间存在一条通路自然后4-通路、8通路等像素距离度量满足上面关系的函数即可欧氏距离:显然,就是一边的距离,满足上面的关系。...原创 2020-08-19 18:20:36 · 4806 阅读 · 0 评论 -
图像处理-基础
可以把图像看成一种矩阵结构高维数据的展示形式,图像处理方法也就是一种高维数据的处理方法。所以图像处理不仅用于我们平常看到的图片的处理,还用于各种其它结构类似图片,具有矩阵结构的数据的处理。比如各种扫描图,指纹什么的。这个结构具体的说是,矩阵的一个元素对应于一维,并且相邻的维度(元素)之间有一定的关系。图像可以抽象为一个数字矩阵,图像的处理就是对这个数字矩阵的处理。所谓交叉学科,从某种程度上来说也可以说就是一门学科,只是要学的东西多些而已。就想学某个专业里面要学不同的课本一样。图像处理的过程:图像输原创 2020-08-13 01:07:54 · 711 阅读 · 0 评论 -
图像处理基础知识
1、亮度、对比度、饱和度在RGB空间内,越白也就越亮,黑色到白色的rgb值为000 000 000 - 255 255 255,于是RGB数值越大图像也就越亮。对比度原创 2020-06-23 18:57:41 · 179 阅读 · 0 评论