图像处理
文章平均质量分 69
爱钻研的小铭
Time will tell.
展开
-
Harris、FAST、SIFT、SURF、ORB角点提取
Harris、FAST、SIFT、SURF、ORB角点提取原创 2023-09-13 19:39:25 · 406 阅读 · 0 评论 -
一阶微分算子和二阶微分算子
一阶微分算子和二阶微分算子原创 2023-09-13 18:07:20 · 554 阅读 · 0 评论 -
霍夫线变换,霍夫圆变换
霍夫变换检测直线、圆,以及椭圆的检测原创 2023-09-12 15:25:45 · 180 阅读 · 1 评论 -
Canny边缘检测算法及实现
Canny边缘检测转载 2023-09-12 14:59:39 · 77 阅读 · 0 评论 -
otsu算法详解
OTSU算法称为最大类间方差法,也称为大津法被认为是图像分割中阈值选取的最佳算法,在图像处理中得到广泛应用。转载 2023-07-11 22:46:41 · 2093 阅读 · 0 评论 -
《Stacked Hourglass Networks for Human Pose Estimation》
这是ECCV2016,密歇根大学的研究团队做的工作,后续的很多人体姿态估计方法都借鉴了hourglass网络结构,并进行了改进,可以说hourglass的网络结构算是受到了业界的认可。1. 研究问题人体姿态估计任务,需要同时利用局部信息和全局信息。2. 研究方法提出沙漏模块,捕获和整合多尺度信息(局部和全局上下文),并且堆叠多个沙漏,重复自下而上,自上而下的推理,结合中间监督的使用,预测人体关键点。单一沙漏模块整个沙漏结构是对称的,输入先经过"bottom-up"过程(池化降采样和一系列的残差原创 2021-11-15 17:35:50 · 1469 阅读 · 0 评论 -
《U-Net: Convolutional Networks for Biomedical Image Segmentation》
U-Net主要是针对生物医学图片的分割,而且,在今后的许多对医学图像的分割网络中,很大一部分会采取U-Net作为网络的主干。1. 研究问题生物医学图像分割任务中缺少大的带标签训练数据集。2. 研究方法Network architecture基于全卷积网络进行扩展,提出了U-Net,通过跳跃连接,将编码器提取的低级特征和解码器提取的高级语义特征联合,提升分割的精度。Overlap-tile strategy通过重叠平铺策略,增加图像边界的上下文信息,提高边界分割效果。解释:因为采用val原创 2021-11-16 11:57:22 · 346 阅读 · 0 评论 -
《Deformable ConvNets v2: More Deformable, Better Results》
总结DCN v2原创 2021-12-03 16:34:38 · 326 阅读 · 0 评论 -
AlexNet
转载:卷积神经网络之AlexNet原创 2021-11-12 21:25:31 · 290 阅读 · 0 评论 -
各种卷积运算
转载:深度可分离卷积各种卷积层的理解(深度可分离卷积、分组卷积、扩张卷积、反卷积)转载 2021-11-29 10:54:47 · 178 阅读 · 0 评论 -
DARTS:differentiable architecture search
详解可微的网络架构搜索算法(DARTS)原创 2021-12-06 09:46:52 · 622 阅读 · 0 评论 -
MobileNetV2
详解MobileNetV2原创 2022-03-10 12:02:51 · 3970 阅读 · 0 评论 -
《Deep Residual Learning for Image Recognition》
1. 研究问题深度神经网络存在两个问题:梯度消失/爆炸:现在已经被解决了,用归一化和BN等方法。网络退化:深层网络比浅层网络的训练误差更大。如图1所示。直觉上来说,深层网络的训练误差不会比浅层网络的误差大,设想一下,对于一个训练好的浅层网络,我们直接在其后面加上几层,拟合一个恒等映射,那么这个深层网络就跟浅层网络的训练误差是一致的,但实际上,会出现上述的网络退化的现象。出现这个现象的原因就是现在的求解器很难从堆叠的非线性层中学习一个恒等映射。2. 研究方法为了解决网络退化问题,提出了残差学习原创 2021-11-01 21:51:01 · 483 阅读 · 0 评论 -
《Spatial Transformer Networks》
1. 研究问题普通的CNN只有局部的平移不变性,而对于大的变换不具有不变性,这样,当新数据相对于训练数据发生大的变换时,可能会导致无法准确的预测。比如,对于分类任务来说,当测试集中的一只猫发生了平移、旋转、缩放等操作,那么很容易造成分类错误。2. 研究方法提出了一个可微分的spatial transformer module(空间变换模块),该模块可以嵌入CNN中,形成spatial transformer networks(空间变换网络)进行端到端的训练,从而赋予CNN对输入图像以及特征图进行任意空原创 2021-11-03 17:38:17 · 745 阅读 · 0 评论 -
分割网络对结构光图像进行分割
使用分割网络对结构光图像进行分割原创 2022-02-10 18:30:57 · 2390 阅读 · 0 评论 -
SENet
这篇文章出自《Squeeze-and-Excitation Networks》,在ILSVRC分类挑战赛上获得了冠军。1. 研究问题大多数CNN都研究如何捕获特征的空间相关性来提高网络的表示能力,这篇文章研究的是捕获特征通道之间的相关性来提高网络性能。2. 研究方法提出了一个Squeeze-and-Excitation block(挤压-激励模块),如图所示。首先,对输入进行卷积操作:从公式可以看到,通道相关性隐含在卷积核v_c中,它是隐式和局部的(除了顶层特征)。这篇文章是在网络中显式的捕原创 2021-11-14 21:49:04 · 1598 阅读 · 0 评论 -
VGGNet
转载:CNN经典算法VGGNet介绍(论文详细解读)原创 2021-11-12 21:50:41 · 147 阅读 · 0 评论 -
ILSVRC-ImageNet历年竞赛优秀网络
转载:ImageNet历年冠军和相关CNN模型ILSVRC-ImageNet历年竞赛冠军ImageNet是一个超过15 million的图像数据集,大约有22,000类。是由李飞飞团队从2007年开始,耗费大量人力,通过各种方式(网络抓取,人工标注,亚马逊众包平台)收集制作而成,它作为论文在CVPR-2009发布。当时人们还很怀疑通过更多数据就能改进算法的看法。深度学习发展起来有几个关键的因素,一个就是庞大的数据(比如说ImageNet),一个是GPU的出现。(还有更优的深度模型,更好的优转载 2021-11-16 21:04:57 · 1926 阅读 · 0 评论 -
GoogLeNet Incepetion V1
这是GoogLeNet的最早版本,出现在2014年的《Going deeper with convolutions》。之所以名为“GoogLeNet”而非“GoogleNet”,文章说是为了向早期的LeNet致敬。1. Motivation提升网络性能的一个直接方法就是构建更深和更宽的网络,但是这会带来两个问题:(1)过拟合(2)庞大的计算量所以文章的主要目标就是研究在增加网络层数和宽度的同时节省计算资源。文章认为解决前面两个问题的方法是将全连接甚至卷积的内部变成稀疏连接。这个观点有两点佐证,其原创 2021-11-13 16:32:02 · 507 阅读 · 0 评论 -
《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》
1. 研究问题流行的CNN由于全连接层的存在,需要固定尺寸的输入图像,这限制了输入图像的纵横比和尺度,当前方法主要通过裁剪或变形将输入图像变换到固定尺寸,这样会导致图像内容的丢失或失真,从而影响图像识别的准确性。2. 研究方法将空间金字塔池化(SPP)加入卷积网络中,生成固定长度的输出特征,而与输入图像的尺寸无关,然后将该特征馈入全连接层或分类器中,完成各种视觉任务。空间金字塔池化层(The Spatial Pyramid Pooling Layer)文章以AlexNet为例,讨论SPP laye原创 2021-11-15 15:20:05 · 1542 阅读 · 0 评论 -
《Feature Pyramid Networks for Object Detection》
翻译FPN原创 2021-12-03 09:46:02 · 2743 阅读 · 0 评论 -
A Review on Deep Learning Techniques Applied to Semantic Segmentation
对基于深度学习的语义分割进行综述原创 2022-03-07 11:56:07 · 1530 阅读 · 0 评论 -
GoogLeNet Inception v2
1. 研究问题深度网络训练存在internal covariate shift 内部协变量偏移的问题,导致训练缓慢。注:内部协变量偏移是指在神经网络训练过程中,其内部的激活层(每一层的输出,同时也是下一层的输入)的分布不断的发生变化的现象,这种现象将导致训练过程的缓慢。2. 研究方法提出了Batch Normalization,使用批量训练数据,对激活层进行归一化,减小激活层的协变量偏移,使得激活层的分布更加稳定,从而加快训练速度。2.1 思想来源该方法受到白化的启发,将白化应用于内部的激活层,原创 2021-11-05 12:13:02 · 170 阅读 · 0 评论 -
DeepLabV3
DeepLabV3详解原创 2022-03-15 12:09:06 · 4506 阅读 · 0 评论 -
超像素、语义分割、实例分割、全景分割
图像分割(Image segmentation)就是根据某些规则把图像中的像素分成不同的部分(打上不同的标签)。1. 超像素(superpixels)超像素并不是在普通的像素基础上继续像微观细分,恰恰相反的是,**超像素是一系列像素的集合,这些像素具有类似的颜色、纹理等特征,距离也比较近。**用超像素对一张图片进行分割的结果见下图,其中每个白色线条区域内的像素集合就是一个超像素。需要注意的是,超像素很可能把同一个物体的不同部分分成多个超像素。其中超像素中比较常用的一种方法是SLIC(simple l转载 2021-11-12 16:07:02 · 2092 阅读 · 1 评论 -
GoogLeNet Inception v4
这是GoogLeNet的第四版本,出自《Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning》。1. Movivation这篇文章在Inception v3的基础上,再次将网络加深加宽,提出了Inception v4,并且研究了Inception结构与ResNet的结合,提出了Inception v3的变体Inception-ResNet-v1,以及Inception v4的变体Inceptio原创 2021-11-14 15:05:39 · 562 阅读 · 0 评论 -
传统图像分割方法详解
详解传统图像分割方法转载 2022-02-11 11:26:11 · 23536 阅读 · 1 评论 -
MobileNetV1
详解MobileNetV1原创 2022-03-09 23:08:43 · 2135 阅读 · 0 评论 -
LeNet
1. 网络结构LeNet-5出自论文Gradient-Based Learning Applied to Document Recognition,是一种用于手写体字符识别的非常高效的卷积神经网络。这个网络虽然只有7层,但是它包含了深度学习的基本模块:卷积层,池化层,全链接层。是其他深度学习模型的基础, 这里我们对LeNet5进行深入分析。各参数层详解1、C1层-卷积层输入图片:32*32卷积核大小:5*5卷积核种类:6输出featuremap大小:28*28 (32-5+1)=28神经元转载 2021-11-12 15:39:15 · 153 阅读 · 0 评论 -
BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm 总结
总结神经网络中的各种归一化方法转载 2021-12-03 18:01:42 · 271 阅读 · 0 评论 -
GoogLeNet Incepetion V3
这是GoogLeNet的第二版本,出自《Rethinking the Inception Architecture for Computer Vision》。对比:googlenet v1 500万参数googlenet v2 少于2500万参数alexnet是google的12倍vggnet是alexnet的3倍多1. 研究问题GoogLeNet设计的初衷就是要又准又快,而如果只是单纯的堆叠网络虽然可以提高准确率,但是会导致计算效率有明显的下降,所以如何在不增加过多计算量的同时提高网络的表转载 2021-11-13 22:11:53 · 491 阅读 · 0 评论 -
《Pyramid Scene Parsing Network》
总结PSPNet原创 2021-11-07 15:50:10 · 276 阅读 · 0 评论 -
超声图像分割
简单介绍超声图像分割背景和方法原创 2022-02-16 21:21:01 · 4578 阅读 · 0 评论 -
超声图像散斑去噪方法
总结超声图像分割 \ 去噪方法原创 2022-02-15 23:39:06 · 5827 阅读 · 0 评论 -
DeepLabV2
详解DeepLabV2原创 2022-03-15 21:47:07 · 1772 阅读 · 0 评论 -
DeepLabV1
这篇文章来自于谷歌的《Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs》,发表于2016年。1. 研究问题研究采用CRF来改善语义分割的边缘结果。2. 研究方法DeepLab提出使用空洞卷积解决图像下采样导致的空间分辨率降低问题,又提出使用全连接CRF解决空间不变性导致的边缘定位精度低的问题。2.1 语义分割存在的挑战将 DCNN 应用于图像标记任务有两个技术障碍:信号下采样 →原创 2022-03-15 22:57:27 · 1032 阅读 · 0 评论 -
《Deep High-Resolution Representation Learning for Human Pose Estimation》
总结HRNet原创 2021-12-03 11:52:54 · 321 阅读 · 0 评论 -
显著性算法 + 伪彩变换
利用opencv得到显著图和伪彩图原创 2022-01-26 10:34:15 · 1989 阅读 · 0 评论 -
图片几何变换
转载:计算机图形学(三)-图形学中的基本变换(缩放、平移、旋转、剪切、镜像)1. 二维变换1.1 缩放变换如果 x 和 y 方向缩放比例相同,则sx=sys_x=s_ysx=sy。1.2 镜像变换y轴镜像x轴镜像原点镜像y=x镜像y=-x镜像1.3 剪切变换简单来说,就是将正方形拉成平行四边形,但有几个特点:变换后物体的y坐标保持不变x坐标在最高的点平移了a,最低点没有移动其它的点移动距离a * Y (Y表示物体上点的y坐标值)1.4 旋转变换转载 2021-11-03 15:48:11 · 397 阅读 · 0 评论 -
图像锐化、直方图均衡、图像增强、图像滤波
参考:https://www.cnblogs.com/wangguchangqing/category/740760.html1. 拉普拉斯算子锐化算法实现:#include <iostream>#include <opencv2/highgui.hpp>#include <opencv2/imgcodecs.hpp>#include <opencv2/imgproc.hpp>using namespace std;using name原创 2021-10-28 10:06:54 · 795 阅读 · 0 评论