图像处理
Xhfei1224
研究方向:数据挖掘/机器学习/深度学习(博士在读)
展开
-
【图像处理】为什么CNN需要固定输入图像的尺寸
全连接层的输入是固定大小的,如果输入向量的维数不固定,那么全连接的权值参数的量也是不固定的,就会造成网络的动态变化,无法实现参数训练目的。全连接层的计算其实相当于输入的特征图数据矩阵和全连接层权值矩阵进行内积,在配置一个网络时,全连接层的参数维度是固定的,所以两个矩阵要能够进行内积,则输入的特征图的数据矩阵维数也需要定。大家都知道,全连接神经网络结构一旦固定,需要学习的参数w是固定的,例如 输入图像是 28*28 = 784,w 的转置= (500,784),===> 输出矩阵的shape:原创 2020-06-08 08:52:04 · 2106 阅读 · 0 评论 -
【图像处理】batchnorm2d函数理解,numpy数据归一化
1.batchnorm2d对一批数据,计算各个维度上的均值和标准差,一批数据有几个维度,就有几个均值,下面代码加红部分,一批数据(2,3,64,64),均值有3个。 m = nn.BatchNorm2d(3,affine=True) input = torch.randn(2, 3, 64, 64) output = m(input) print(m) print(output)2.numpy数据归一化最值归一化: 把所有的数据映射到0-1之间适用:有明显边界的情况x为m行n列的原创 2020-05-30 15:00:28 · 2767 阅读 · 0 评论 -
【图像处理】CNN 入门讲解:什么是全连接层
CNN 入门讲解:什么是全连接层上述链接中讲解的比较清楚。以下内容做一个摘录和总结。重点:从上图我们可以看出,猫在不同的位置,输出的feature值相同,但是位置不同对于电脑来说,特征值相同,但是特征值位置不同,那分类结果也可能不一样而这时全连接层filter的作用就相当于喵在哪我不管我只要喵于是我让filter去把这个喵找到实际就是把feature map 整合成一个值这个值大哦,有喵这个值小那就可能没喵和这个喵在哪关系不大了有没有鲁棒性有大大增强了...原创 2020-05-21 09:45:20 · 1094 阅读 · 0 评论 -
【遥感图像分类】MG-CAP:用于遥感场景分类的多粒度规范化外观池化-20200419
MG-CAP:用于遥感场景分类的多粒度规范化外观池化表现SOTA!性能优于RTN等网络,已收录于IEEE TIP。作者团队:东安格利亚大学&纽卡斯尔大学&IIAI由于较大的视觉语义差异,识别遥感场景图像仍然具有挑战性。这些主要是由于缺少可用于将像素级表征与高级语义标签对齐的详细标注所致。由于标记过程是劳动密集型的并且是主观的,因此我们提出一种新颖的多粒度规范化外观合并(MG-C...原创 2020-04-20 17:58:38 · 684 阅读 · 0 评论 -
【遥感图像分类】LiteDenseNet:用于高光谱图像分类(HSI)的轻量级网络-20200420
LiteDenseNet:用于高光谱图像分类(HSI)的轻量级网络表现SOTA!性能优于DBDA、DBMA和FDSSC等网络,作者团队:武汉大学遥感信息工程学院近年来,基于深度学习的高光谱图像(HSI)分类一直是个关注度很高的领域。然而,作为一种数据驱动算法,深度学习方法通常需要大量的计算资源和高质量的标记数据集,而高性能计算和数据注释的成本却很高。在本文中,为了减少对大量计算和标记样本的...原创 2020-04-20 17:49:10 · 2361 阅读 · 0 评论 -
【图像处理】ImageNet Large Scale Visual Recognition Challenge 论文阅读
这篇著名的论文总结了2010-2014年以来ImageNet比赛中关于图像分类和物体识别领域的研究,在谷歌学术上有2800+的引用量。(另一篇2009年的ImageNet: A Large-Scale Hierarchical Image Database有4400+引用量。因为比赛使得计算机在图像分类和物体识别方面正确率已经超过人类,所以2017年是ImageNet最后一届比赛)。整篇论文分7...原创 2020-04-18 23:22:27 · 1057 阅读 · 0 评论 -
【图像处理】全局平均池化(Golbal Average Pooling)
定义:将特征图所有像素值相加求平均,得到一个数值,即用该数值表示对应特征图目的:替代全连接层效果:减少参数数量,减少计算量,减少过拟合思路:如下图所示。假设最终分成10类,则最后卷积层应该包含10个滤波器(即输出10个特征图),然后按照全局池化平均定义,分别对每个特征图,累加所有像素值并求平均,最后得到10个数值,将这10个数值输入到softmax中,得到10个概率值,即这张图片属于每个类别...原创 2020-03-30 19:54:52 · 3838 阅读 · 0 评论 -
【计算机视觉】用于计算机视觉的CNN网络复现大全(支持5种主流深度学习框架)
该项目包含复现的各种分类模型,以及用于训练/评估/转换的脚本。(复现80多种网络模型,作者代码功底太强了,关键还掌握并用5种深度学习框架来复现)【支持的深度学习框架】PyTorch、TensorFlow1.x/2.x、Keras、MXNet和Chainer【支持的网络模型】MixNet、EfficientNet、FBNet、MobileNetV1-V3、ShuffleNetV1-V2、Da...原创 2020-03-28 22:39:55 · 635 阅读 · 0 评论 -
【图像处理】Region proposals 是什么?如何提取?
Region proposals 是什么?如何提取?转载 2020-01-07 16:59:17 · 1038 阅读 · 0 评论 -
【图像处理】Python中plt.imshow(image)无法显示图片解决办法
参考链接:https://blog.csdn.net/sy20173081277/article/details/84109743代码如下:def imshow(img): img = img / 2 + 0.5 # unnormalize npimg = img.numpy() print(npimg) plt.imshow(np.transpose(...转载 2019-11-29 21:57:32 · 2826 阅读 · 0 评论 -
【图像处理】卷积Conv1D、Conv2D、Conv3D
本文首先介绍二维卷积,之后再介绍一维卷积与三维卷积的具体流程,并描述其各自的具体应用。1. 二维卷积图中的输入的数据维度为14×14上述内容没有引入channel的概念,也可以说channel的数量为1。如果将二维卷积中输入的channel的数量变为3,即输入的数据维度变为(14×14×3)以上都是在过滤器数量为1的情况下所进行的讨论。如果将过滤器的数量增加至16,即16个大小为10×...原创 2019-10-11 15:17:15 · 7203 阅读 · 0 评论 -
【图像处理-OCR】图像场景文本识别相关论文总结
现有使用技术:1、传统场景文本识别方法:(1) 滑窗(sliding-window)和强连通分支(Connected Components (CCs))相关论文:L. Neumann and J. Matas. Scene text localization andrecognition with oriented stroke detection. In Proc. of ICCV...原创 2019-06-30 11:28:30 · 2076 阅读 · 0 评论 -
【图像处理小知识】目标检测中的这个IOU评价函数(intersection-over-union)
在目标检测的评价体系中,有一个参数叫做 IoU ,简单来讲就是模型产生的目标窗口和原来标记窗口的交叠率。具体我们可以简单的理解为:即检测结果DetectionResult与真实值Ground Truth的交集比上它们的并集,即为检测的准确率 IoU :举个例子,下面是一张原图:然后我们对其做下目标检测,其DR = DetectionResult,GT = GroundTruth。黄色...转载 2019-06-16 09:16:05 · 1093 阅读 · 0 评论