图像分类
文章平均质量分 89
计算机视觉——图像分类
Nick Blog
这个作者很懒,什么都没留下…
展开
-
Deformable Convolutional Networks 论文阅读
摘要卷积神经网络由于固定的几何结构一直受限于对几何形变的建模,这篇工作引入了两个新模块——deformable convolution和deformable RoI pooling。deformable convolution 和deformable RoI pooling都是基于一个平行网络分支学习offset(偏移),使卷积核在input map的采样点发生偏移,集中于我们感兴趣的区域或目标。同时这个组件可以轻松地替代CNN中的普通卷积,并且很容易通过反向传播进行end-to-end的训练。1. 简原创 2020-05-11 08:44:10 · 271 阅读 · 1 评论 -
HRNet阅读笔记及代码理解
摘要:大多数现有方法从由高到低分辨率网络产生的低分辨率表示中恢复高分辨率表示。相反,本文在整个过程中保持高分辨率的表示。我们将高分辨率子网开始作为第一阶段,逐步添加高到低分辨率子网以形成更多阶段,并行连接多个子网,每个子网具有不同的分辨率。我们进行重复的多尺度融合,使得高到低分辨率表示可以重复从其他分辨率的表示获取信息,从而导致丰富的高分辨率表示。因此,预测的关键点热图可能更准确,空间更精确。1. 简介1.1 现有方法(a) 对称结构,先下采样,再上采样,同时使用跳层连接恢复下采样丢失的信息;原创 2020-12-14 00:28:55 · 2961 阅读 · 1 评论 -
CNN训练与优化技巧
Bag of Tricks for Image Classification with Convolutional Neural Networks文章地址github上的相关代码1. 简介现有很多网络的进步并非仅仅来自改进的模型架构。训练程序的改进,包括损失函数的变化,数据预处理和优化方法也起了重要作用。在过去几年中已经提出了大量这样的改进,但是受到的关注相对较少。在文献中,大多数只是作为实现细节提及,而其他只能在源代码中找到。我们通过实验表明,有几个技巧可以显著提高准确性,将它们组合在一起可以进原创 2020-12-17 09:27:17 · 3609 阅读 · 0 评论 -
ResNet阅读笔记
Deep Residual Learning for Image Recognition摘要更深的神经网络更难训练。我们提出了一种残差学习框架来减轻网络训练,这些网络比以前使用的网络更深。我们明确地将层变为学习关于层输入的残差函数,而不是学习未参考的函数。我们提供了全面的经验证据说明这些残差网络很容易优化,并可以显著增加深度来提高准确性。在ImageNet数据集上我们评估了深度高达152层的残差网络——比VGG[40]深8倍但仍具有较低的复杂度。这些残差网络的集合在ImageNet测试集上取得了3.57原创 2020-12-16 12:44:26 · 633 阅读 · 0 评论 -
GoogleNet阅读笔记
Going Deeper with Convolutions摘要我们在ImageNet大规模视觉识别挑战赛2014(ILSVRC14)上提出了一种代号为Inception的深度卷积神经网络结构,并在分类和检测上取得了新的最好结果。这个架构的主要特点是提高了网络内部计算资源的利用率。通过精心的手工设计,我们在增加了网络深度和广度的同时保持了计算预算不变。为了优化质量,架构的设计以赫布理论和多尺度处理直觉为基础。我们在ILSVRC14提交中应用的一个特例被称为GoogLeNet,一个22层的深度网络,其质量原创 2020-12-16 12:44:39 · 299 阅读 · 0 评论 -
VGGNet阅读笔记
摘要:我们的主要贡献是使用具有非常小尺寸的卷积核 (3x3) 的体系结构对深度网络进行深入评估,这表明通过将深度推到16-19个权重层可以实现对现有技术配置的显着改进。1. 简介**第一段:**寒暄一下,说一下前人工作和领域发展,ImageNet开源数据集和GPU。**第二段:**稍微过一下发展历程和发展路线,比如多尺度啦,紧接着简略地说他们解决的深度问题,由于全部使用3x3卷积。**第三段:**说一下自己网络的优点,不仅在imagenet数据集上效果好了,也适用于其他数据集,并且甚至可以使用他们原创 2020-12-14 00:54:30 · 170 阅读 · 0 评论 -
遥感图像场景分类常用数据集
1. UC Merced Land-Use Data Set图像像素大小为256x256,总包含21类场景图像,每一类有100张,共2100张。下载地址:http://weegee.vision.ucmerced.edu/datasets/landuse.html2. WHU-RS19 Data Set图像像素大小为600x600,总包含19类场景图像,每一类大概50张,共1005张。...原创 2020-03-20 21:09:00 · 1510 阅读 · 0 评论 -
用keras 实现cifar10
用keras 实现cifar10以下是代码 1 # -*- coding: utf-8 -*- 2 __author__ = 'Administrator' 3 4 5 from keras.datasets import cifar10 6 from keras.utils import np_utils 7 from keras.models import Seq...原创 2018-04-13 17:11:26 · 2706 阅读 · 0 评论 -
Keras实现卷积神经网络
在安装过Tensorflow后,在在安装Keras默认将TF作为后端,Keras实现卷积网络的代码十分简洁,而且keras中的callback类提供对模型训练过程中变量的检测方法,能够根据检测变量的情况及时的调整模型的学习效率和一些参数.下面的例子,MNIST数据作为测试import pandas as pdimport numpy as npimport matplotlib.pyplot...转载 2018-04-19 16:42:54 · 1330 阅读 · 0 评论 -
【Keras】从两个实际任务掌握图像分类
我们一般用深度学习做图片分类的入门教材都是MNIST或者CIFAR-10,因为数据都是别人准备好的,有的甚至是一个函数就把所有数据都load进来了,所以跑起来都很简单,但是跑完了,好像自己还没掌握图片分类的完整流程,因为他们没有经历数据处理的阶段,所以谈不上走过一遍深度学习的分类实现过程。今天我想给大家分享两个比较贴近实际的分类项目,从数据分析和处理说起,以Keras为工具,彻底掌握图像分类任务。...转载 2018-03-20 19:31:20 · 1781 阅读 · 3 评论