图像
醉小义
学习算法让自己有更大的提升
展开
-
高斯滤波
高斯滤波图像滤波之高斯滤波(Gauss filter)概述:高斯滤波:高斯滤波在图像处理概念下,将图像频域处理和时域处理相联系,作为低通滤波器使用,可以将低频能量(比如噪声)滤去,起到图像平滑作用。高斯滤波是一种线性平滑滤波,适用于消除高斯噪声,广泛应用于图像处理的减噪过程。通俗的讲,高斯滤波就是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的其他像素值经过加权平均后得到。高斯...转载 2018-06-30 20:23:34 · 6151 阅读 · 0 评论 -
反卷积与反卷积核的初始化问题
导论:https://blog.csdn.net/qq_30638831/article/details/81532892https://cv-tricks.com/image-segmentation/transpose-convolution-in-tensorflow/https://zhuanlan.zhihu.com/p/38964806tf.nn.conv2d_t...原创 2018-10-19 20:12:14 · 3329 阅读 · 5 评论 -
语义分割,去除边缘线代码
import tensorflow as tfimport scipy.misc as msc''' 对于语义分割的边缘线,白色的为255,进行去除'''def remove_ignore_label(gt ,output=None ,pred=None): ''' 去除label为255的值,进行交叉熵的计算 gt: not one-hot...原创 2018-10-28 12:30:44 · 1189 阅读 · 0 评论 -
关于卷积的特征映射
对于input=(1,4,4,2) 对应卷积核为3*3 channel从2映射为5个特征 (3,3,2,5), s=1,k=3 pad=valid是如何计算的?输出为 (1,2,2,5)原创 2018-10-24 20:44:32 · 2179 阅读 · 0 评论 -
关于dilated convolution(空洞卷积)感受野的计算
关于感受野的定义请参考:https://www.jianshu.com/p/2b968e7a1715定义:感受野用来表示网络内部的不同神经元对原图像的感受范围的大小,或者说,convNets(cnn)每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。 计算公式: 从前往后: F后 = (F前 - 1) + k (F代表感受野的大小,...原创 2018-11-01 20:20:00 · 24918 阅读 · 17 评论 -
iou(交并比)的概念
交并比(Intersection-over-Union,IoU),目标检测中使用的一个概念,是产生的候选框(candidate bound)与原标记框(ground truth bound)的交叠率,即它们的交集与并集的比值。最理想情况是完全重叠,即比值为1。计算公式:def calculateIoU(candidateBound, groundTr...转载 2018-11-02 13:04:52 · 16133 阅读 · 4 评论 -
Global average Pooling
最近在看关于cifar10 的分类的识别的文章在看all convolution network 中看到中用到一个global average pooling 下面就介绍一下global average pooling 这个概念出自于 network in network 主要是用来解决全连接的问题,其主要是是将最后一层的特征图进行整张图的一个均值池化,形成一个特征点,将这些...转载 2018-11-12 17:00:52 · 286 阅读 · 0 评论 -
高斯滤波卷积核
print(cv2.getGaussianKernel(3, 0))# 结果:[[0.25][0.5][0.25]]源码: https://github.com/ex2tron/OpenCV-Python-Tutorial/blob/master/10.%20%E5%B9%B3%E6%BB%91%E5%9B%BE%E5%83%8F/cv2_source_code_getGaussi...转载 2018-12-07 22:27:41 · 4866 阅读 · 0 评论 -
图像金字塔
0 序 图像金字塔实际上是一张图片在不同尺度下的集合,即原图的上采样和下采样。常见的金字塔包括高斯金字塔和拉普拉斯金字塔,但是也有一些其它算法衍生的金字塔,并不一定要高斯模糊。需根据自身应用而定,参考文献0中所述的理由我并不认同。 图像金字塔更多的是一种构建不同尺度空间的思想,网络上搜索较多的可能是在SIFT算法中的应用了,除此之外,还可以应用在光流中,slam的姿...转载 2018-12-08 10:01:37 · 2155 阅读 · 0 评论 -
VOC数据集颜色对应关系与代码
VOC颜色和分类的对于关系: code:def voc_colormap(N=256): def bitget(val, idx): return ((val & (1 << idx)) != 0) cmap = np.zeros((N, 3), dtype=np.uint8) for i in range(N): ...原创 2018-10-18 16:05:54 · 4440 阅读 · 1 评论 -
目标检测之选择性搜索-Selective Search
在基于深度学习的目标检测算法的综述 那一节中我们提到基于区域提名的目标检测中广泛使用的选择性搜索算法。并且该算法后来被应用到了R-CNN,SPP-Net,Fast R-CNN中。因此我认为还是有研究的必要。传统的目标检测算法大多数以图像识别为基础。一般可以在图片上使用穷举法或者滑动窗口选出所有物体可能出现的区域框,对这些区域框提取特征并进行使用图像识别分类方法,得到所有分类成功的区域后,通过非...转载 2018-09-21 15:59:50 · 2868 阅读 · 2 评论 -
关于一张RGB图片,在numpy中的存储。
假设图片为 width:200 heigh:300在numpy中,shape为 (1,300,200,3) 意思就是在矩阵中每一列,存储一张图片,即一个特征。就比如:[ [[0.0, 1.0], [2.0, 3.0], [4.0, 7.0], [6.0, 6.0]], [[8.0, 9.0], [10.0, 11.0], [12.0, 13.0], [14.0, 15...原创 2018-10-02 15:02:03 · 4167 阅读 · 3 评论 -
RGB、YUV和HSV颜色空间模型以及代码
一、概述颜色通常用三个独立的属性来描述,三个独立变量综合作用,自然就构成一个空间坐标,这就是颜色空间。但被描述的颜色对象本身是客观的,不同颜色空间只是从不同的角度去衡量同一个对象。颜色空间按照基本机构可以分为两大类:基色颜色空间和色、亮分离颜色空间。前者典型的是RGB,后者包括YUV和HSV等等。二、RGB颜色空间1、计算机色彩显示器和彩色电视机显示色彩的原理一样,都是采用R、G、B相加混色的原理...转载 2018-06-28 08:57:30 · 1165 阅读 · 0 评论 -
机器视觉 Local Binary Pattern (LBP)
Local binary pattern (LBP),在机器视觉领域,是非常重要的一种特征。LBP可以有效地处理光照变化,在纹理分析,纹理识别方面被广泛应用。LBP 的算法非常简单,简单来说,就是对图像中的某一像素点的灰度值与其邻域的像素点的灰度值做比较,如下图所示:如果邻域像素值比该点大,则赋为1,反之,则赋为0,这样从左上角开始,可以形成一个bit chain,然后将该 bit chain 转...转载 2018-06-28 10:36:04 · 5156 阅读 · 0 评论 -
关于tfrecord写入和取出图片的维度不同
写入:ima = img_array[index][1].tobytes()example = tf.train.Example( features=tf.train.Features( feature={ 'label': _int64_feature( int(img_array[index][0])), # label ...原创 2018-09-13 09:06:54 · 738 阅读 · 12 评论 -
深度学习中的感受野计算
https://blog.csdn.net/kuaitoukid/article/details/46829355https://blog.csdn.net/hungryof/article/details/50241351概念:感受野(receive field)是指当前feature map中的一个原子点P与输入层中多少个原子个数相关的问题,假设输入层相关的点为(RF*RF)个(假...转载 2018-09-13 19:33:29 · 2291 阅读 · 3 评论 -
Census 变换
原文:http://www.cnblogs.com/aslmer/p/6369936.html1、立体匹配算法主要可分为两大类:基于局部约束和基于全局约束的立体匹配算法.(一)基于全局约束的立体匹配算法:在本质上属于优化算法,它是将立体匹配问题转化为寻找全局能量函数的最优化问题,其代表算法主要有图割算法、置信度传播算法和协同优化算法等.全局算法能够获得较低的总误匹配率,但算法复杂度较高,很...转载 2018-09-19 20:57:08 · 4190 阅读 · 1 评论 -
Hamming Distance汉明距离
汉明距离是使用在数据传输差错控制编码里面的,汉明距离是一个概念,它表示两个(相同长度)字对应位不同的数量,我们以d(x,y)表示两个字x,y之间的汉明距离。对两个字符串进行异或运算,并统计结果为1的个数,那么这个数就是汉明距离。 在信息论中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。例如:10...原创 2018-09-19 21:01:41 · 6825 阅读 · 0 评论 -
反卷积(Transposed Convolution, Fractionally Strided Convolution or Deconvolution)
反卷积(Deconvolution)的概念第一次出现是Zeiler在2010年发表的论文Deconvolutional networks中,但是并没有指定反卷积这个名字,反卷积这个术语正式的使用是在其之后的工作中(Adaptive deconvolutional networks for mid and high level feature learning)。随着反卷积在神经网络可视化上的...转载 2018-09-26 10:40:07 · 654 阅读 · 0 评论 -
反卷积(Deconvolution)、上采样(UNSampling)与上池化(UnPooling)
原文:https://blog.csdn.net/A_a_ron/article/details/79181108前言在看图像语义分割方面的论文时,发现在网络解码器结构中有的时候使用反卷积、而有的时候使用unpooling或或者unsampling,查了下资料,发现三者还是有不同的。这里记录一下。图示理解使用三张图进行说明:图(a)表示UnPooling的过程,特点是在Maxp...转载 2018-09-26 10:46:01 · 3294 阅读 · 0 评论 -
对全局平均池化(GAP)过程的理解
对学习Class Activation Mapping(CAM)原文献的时候提到的全局平均池化GAP方法做个简单的知识补充。所谓的全局就是针对常用的平均池化而言,平均池化会有它的filter size,比如 2 * 2,全局平均池化就没有size,它针对的是整张feature map.全局平均池化(Global average Pooling)由 M. Lin, Q. Chen, and ...转载 2018-12-07 16:02:45 · 2907 阅读 · 3 评论