图像处理
文章平均质量分 55
冰雪棋书
这个作者很懒,什么都没留下…
展开
-
计算机视觉&深度学习 相关整理
1、计算机视觉1.1 发展历程深度学习发展历程:分类模型和精度LeNet :串联,2个卷积3个全连接,最早用于数字识别AlexNet:残差,12年ImageNet冠军,5个卷积3个全连接,多个小卷积代替单一大卷积;使用ReLu激活函数,解决梯度小数问题;引入dropout避免模型过拟合;最大池化;ZF-Net:13年ImageNet冠军,只用了一块GPU的稠密连接结构;将AlexNet第一层卷积核由11变成7,步长由4变为2。VGG-Net:14年ImageNet分类第二名,更深的网络,原创 2022-02-16 17:50:08 · 930 阅读 · 0 评论 -
智能钢管计数
钢管检测计数原创 2022-08-25 17:54:10 · 1428 阅读 · 2 评论 -
图像分辨率+像素+尺寸+文件内存大小
图像分辨率1、图像分辨率是指在计算机中保存和显示一幅数字图像所具有的分辨率,它和图像的像素有直接的关系。例如,一张分辨率为640×480像素的图片,其分辨率就达到了307200像素,也就是常说的30万像素;而一张分辨率为1600×1200的图片,它的像素就是200万这样,图像分辨率表示的是图片在长和宽上占的点数的单位。一张数码图片的长宽比通常是4:3。2、图像分辨率决定图像的质量。对于同样尺寸的一幅图,如果图像分辨率越高,则组成该图的图像像素数目越多,像素点也越小,图像越清晰、逼真。如:72dpi分辨率原创 2022-03-24 17:01:11 · 8595 阅读 · 0 评论 -
图像 分割
图像分割CNN图像语义分割:下采样+上采样:convolution + Deconvolution/resize多尺度特征融合:特征逐点相加/特征channel维度拼接获得像素级别的segement map:对每个像素点进行类别判断网络父辈生辰增加的结构丢弃的结构优势劣势VGG16FCN的灵感来源FCNVGG162014一个Deconv层(从无到有)所有fc层简单粗糙DeconvNetFCN2015Unpooling层(从原创 2022-01-26 18:56:16 · 2167 阅读 · 0 评论 -
OpenGL
OpenGL是图像opencl是并行处理原创 2021-11-02 17:58:55 · 49 阅读 · 0 评论 -
导向滤波-------图像去雾、图像平滑、图像Matting
简介:导向滤波(Guided Fliter)显式地利用 guidance image 计算输出图像,其中 guidance image 可以是输入图像本身或者其他图像。导向滤波比起双边滤波来说在边界附近效果较好;另外,它还具有 O(N) 的线性时间的速度优势。 相关工作: (1)Explicit Weighted-Average Filters(显示加权平均滤波器): 双边滤波可以在平滑的过程中保持边缘,但是会出现不希望的gradient reversal的artifact。原因在于...原创 2021-11-02 17:27:24 · 806 阅读 · 0 评论 -
图像像素、图像大小
1、一个像素占多大内存 多少字节取决于需要存储一个像素的多少信息,以及是否采用了压缩技术如果是非黑即白的二值像素,不压缩的情况下一个像素只需要1bit如果是256种状态的灰度图像,不压缩的情况下一个像素需要8bit(1字节,256种状态)如果256种状态标识屏幕上某种颜色的灰度,而屏幕采用三基色红绿蓝(RGB),不压缩的情况下一个像素需要占24bit(3字节),这个就是常说的24位真彩色。还有各种其他的存储方式,例如15bit,16bit,32bit如果考虑到压缩,情况就更复杂了,是原创 2020-12-17 10:03:15 · 1751 阅读 · 0 评论 -
仿射变换+透视变换+欧式变换(刚体变换)+相似变换+剪切变换
仿射变换(引入齐次坐标)齐次坐标:就是用n+1维来表示n维坐标。一个2D笛卡尔坐标末尾加上一个额外的变量w来形成2D齐次坐标,即一个点(X,Y)在齐次坐标里面变成了(x,y,w),并且有X=x/w, Y=y/w为什么叫齐次坐标:(1, 2, 3), (2, 4, 6) 和(4, 8, 12)对应同一个Euclidean point (1/3, 2/3),任何标量的乘积,例如(1a, 2a, 3a) 对应 笛卡尔空间里面的(1/3, 2/3) 。因此,这些点是“齐次的”,因为他们代表了笛卡尔坐标.原创 2021-02-20 18:03:57 · 1822 阅读 · 0 评论 -
方向梯度直方图和亮度梯度直方图
方向梯度直方图---- HOG亮度梯度直方图----- sobel 等边缘检测 (图像梯度一般就是指图像的亮度梯度)区别:HOG描述符关注对象的结构或形状,那与为图像提取的边缘特征的不同是什么?边缘特征提取只识别像素是否是边缘,HOG除了能识别是否是边缘,还能够提供边缘方向。这是通过提取边缘的梯度和方向(即大小和方向)来实现的。此外,这些方向是在“局部”进行部分计算的。这意味着整个图像被分割成更小的区域,对于每个区域,计算梯度和方向。最后,HOG将分别为这些区域生成一个直方图。直方图是...原创 2021-02-20 18:02:59 · 611 阅读 · 0 评论 -
python-opencv 图像处理基础 (四)1D直方图 2D直方图
定义一维直方图:只考虑了一个特性,即像素的灰度值。二维直方图:考虑两个特征,通常是色度和饱和度。代码opencv 二维直方图一维的直方图使用函数cv2.calcHist()进行计算,从BGR转换成灰度图。二位直方图使用相同的函数cv2.calcHist()进行计算。对于颜色直方图,需要将图像从RGB转换为HSV。对于2D直方图,其参数将被修改如下:通道=0,1,因为需要同时处理H和S平面。用于H平面的bin=180,以及256的S平面。范围在[0,180,0,256]色值原创 2021-03-11 19:43:10 · 997 阅读 · 0 评论 -
python-opencv 图像处理基础 (二)高斯噪声+椒盐噪声+滤波
1、模糊操作:均值模糊、中值模糊、自定义模糊#均值模糊、中值模糊、自定义模糊#模糊操作的基本原理#1、基于离散卷积#2、定义好每个卷积核#3、不同卷积核得到不同的卷积效果#4、模糊是卷积的一种表现def blur_demo(image): #均值模糊 dst=cv2.blur(image,(1,10)) cv2.imshow("blur_demo",dst)def median_blur_demo(image): #中值模糊 dst=cv2.medianBlur(image原创 2021-03-11 18:33:31 · 3845 阅读 · 0 评论 -
python-opencv 图像处理基础 (一)
1、显示/保存图像 获取图像信息 获取单通道图像 合并三通道import cv2import numpy as np #-----------------------显示/保存图像 获取图像信息 获取单通道图像 合并三通道 --------------------------def get_img_info(img): print(type(img)) print(img.shape) print(img.size) print(img.dtype) print(np.array.原创 2021-03-03 14:37:30 · 815 阅读 · 3 评论 -
图像金字塔和特征金字塔
图像金字塔图像金字塔是图像多尺度表达的一种,是一种以多分辨率来解释图像的有效但概念简单的结构。一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低。在OpenCV中,有关图像金字塔的操作有pyrup()和pyrdown(),分别用来完成上采样和下采样,其实在OpenCV中有关于图片缩放的更直接的函数,即resize()。图像金字塔分为两类原创 2021-07-29 16:06:49 · 1349 阅读 · 0 评论 -
图像锐化和平滑
锐化通过增加高频分量来减少图像中的模糊,又称为高通滤波。锐化处理在增强图像的边缘的同时增加了图像的噪声。平滑平滑与锐化相反,平滑滤掉图像的高频分量,从而减少图像噪声,使得图像变得有些模糊。...原创 2021-10-27 20:31:11 · 3721 阅读 · 0 评论