深度学习
页图
本人学生一枚,旨在于把自己学习积累的问题,经验与大家分享。
展开
-
论文:Weakly Supervised Data Augmentation Network for Fine-Grained Visual Classification
本篇论文主要使用了数据增强的方法,和一般图片随机的翻转,裁剪的方法不同,本文提出了一种基于注意力机制的数据增强方法。通过基础网络提出图片的特征图确定目标的大致位置,同时根据特征图生成一个注意力图(attention maps)来表征对象的显著特征部分,随机选择一张注意力图,通过注意力剪裁和注意力删除的方式去增强这张图片(即只保留一个局部特征和只删除一个局部特征),最后原图和增强对数据都会被作为输入数据进行训练。对生成的特征图和注意力图进行BAP(双线性注意力池化)获得全部的局部特征后进行分类。本篇文章的原创 2020-12-24 15:24:01 · 581 阅读 · 0 评论 -
论文:Learning a Discriminative Filter Bank within a CNN for Fine-grained Recognition
Abstract与早期使用CNN特性的多阶段框架相比,最近采用的端到端深度精细识别方法从本质上提高了CNN的中层学习能力。以前的方法是通过引入一个辅助网络将定位信息注入到主分类网络中,或者通过一个复杂的特征编码方法来获取更高阶的特征统计量来实现这一点。我们证明了中层表示学习可以在CNN框架内得到增强,通过学习一组卷积滤波器来捕获特定的类别有区别的patch而不需要额外的部分或边框标注。该滤波器组具有良好的结构、适当的初始化和鉴别学习,通过一种带有卷积滤波器监督和非随机层初始化的新型非对称多流结构。实验结果原创 2020-12-15 20:13:42 · 368 阅读 · 1 评论 -
cuda9.0 安装 pytorch1.2 以及torch.cuda.is_available()=false的解决办法
服务器 cuda9.0.x 安装 pytorch1.2 稳定版 :执行 conda install pytorch torchvision cudatoolkit=9.0 -c pytorch 安装cuda9.0对应的pytorch,相应的,cuda版本号应该可以任意更改。在这里插入图片描述参考:https://blog.csdn.net/mamemory/article/details/100526991l...转载 2020-12-14 19:49:30 · 601 阅读 · 0 评论 -
PIL,plt显示tensor类型的图像
该方法针对显示Dataloader读取的图像。PIL 与plt中对应操作不同,但原理是一样的,我试过用下方代码Image的方法 # 方法1:Image.show() # transforms.ToPILImage()中有一句 # npimg = np.transpose(pic.numpy(), (1, 2, 0)) # 因此pic只能是3-D Tensor,所以要用image[0]消去batch那一维 # 原作者的我运行失败,改成下面这样 img = transforms.ToPILImag转载 2020-12-13 15:41:08 · 3638 阅读 · 0 评论 -
处理Stanford cars数据集用于目标检测训练
处理cars_annos.mat文件:提取去数据集的类型名称提取出序号, 图片名, 类别, 属于测试集还是训练集import scipy.io# 提取标签def process1(): data = scipy.io.loadmat('./data/cars_annos.mat') class_names = data['class_names'] f_class = open('label_map.txt1', 'w') num = 1 fo..原创 2020-12-10 18:51:21 · 2277 阅读 · 0 评论 -
pytorch实现resnet网络结构
ResNet结构和pytorch实现resnet的网络结构都是经过5个不同数量的残差块+最后一个全连接分类完成的。在resnet50以后,由于层数的增加残差块发生了变化,从原来3x3卷积变为三层卷积,卷积核分别为1x1、3x3、1x1,减少了网络参数。主要通过两种方式:1.用zero-padding去增加维度 2.用1x1卷积来增加维度这是我之前做的读书笔记,忘记看的什么书了,就不加引用了,抱歉from torch import nnimport torch as tfrom torch.n原创 2020-11-12 21:02:06 · 1005 阅读 · 0 评论 -
Ubuntu16.04安装Mediapipe
最近在做一个和手势识别相关的东西,了解到google的MediaPipe效果不错而且开源,想着学习一下,于是有了下文的安装, MediaPipe官网提供多种操作系统的安装方法,这里我选择ubuntu系统Ubuntu安装MediaPipegithub下载Meidapipe代码$ git clone https://github.com/google/mediapipe.git# Cha...原创 2020-04-30 16:14:46 · 6124 阅读 · 3 评论 -
Faster R-CNN论文详解
废话不多说,上车吧,少年paper链接:Faster R-CNN: Towards Real-Time Object Detecti...转载 2019-09-22 14:10:14 · 780 阅读 · 0 评论 -
Fast R-CNN论文详解
paper链接:Fast R-CNN &创新点规避R-CNN中冗余的特征提取操作,只对整张图像全区域进行一次特征提取;用RoI pooling层取代最后一层max pooling层,同时引入建议框信息,提取相应建议框特征;Fast R-CNN网络末尾采用并行的不同的全连接层,可同时输出分类结果和窗口回归结果,实现了end-to-end...转载 2019-09-22 13:54:46 · 1569 阅读 · 0 评论 -
利用Tensorflow实现VGG16及训练自己的数据
...转载 2019-09-19 14:13:29 · 2320 阅读 · 0 评论 -
卷积神经网络CNN讲解
1.CNN的优点既然要说卷积卷积神经网络的优点,那就要先讲下全连接的缺点,没有对比就没有伤害。(1)FC缺点训练参数过多 假设对1000x1000像素的图片使用全连接进行处理,每层节点256个,那么仅一层就需要1000x1000x256=2亿个(忽略b),这只是灰度图。如果是RGB图片呢?在乘上3约为6亿个参数。如果想要达到较好的效果,再加几个隐藏层,需要的参数是特别多的,...原创 2019-09-17 16:18:10 · 835 阅读 · 0 评论