深度学习
文章平均质量分 67
喜欢历史的工科生
这个作者很懒,什么都没留下…
展开
-
pytorch识别minist数据集
import torchfrom torchvision import transforms #针对图像做原始处理的工具from torchvision import datasetsfrom torch.utils.data import DataLoader #以上三行用于构建DataLoaderimport torch.nn.functional as F #使用relu激活函数import torch.optim as optim原创 2021-04-29 16:41:44 · 371 阅读 · 0 评论 -
pytorch多分类问题
多分类问题softmax分类器对于多分类,假如我们对每个输出层的神经元用sigmoid输出,并用交叉熵损失进行训练,那么可能会产生一个模糊的结果,比如对于某一输入,第一类的输出概率为0.8,第二类的输出概率为0.8,第三类的为0.9那么我们应该选择哪个结果?所以,对于多分类,我们希望输出层的神经元之间是有竞争的,我们希望神经网络输出的是一个分布,每个输出大于0,且和为1假设 Zl∈RkZ^l\in R^kZl∈Rk是神经网络的输出层,softmax函数:P(y=i)=eZi∑j=0K−1eZj原创 2021-04-29 16:37:37 · 315 阅读 · 0 评论 -
pytorch Mini-Batch
梯度下降有几种选择:梯度下降(BatchGD): 计算速度快(运用GPU的并行能力),但是数据集大的话硬件受不了随机梯度下降(SGD):它的随机性会克服鞍点的问题(遇到鞍点,梯度为0 就走不动了)但是运行时间过长,没有办法运用GPU的并行能力Mini-Batch进行均衡epoch:对所有样本进行一次前向传播和后向传播Batch-size:进行一次前向传播和反向传播所用的样本数量Iteration:数据集中有多少个batch 例如1000个样本 batch-size为100 那么iterati原创 2021-04-29 16:35:52 · 1068 阅读 · 0 评论 -
pytorch多层神经网络
import numpy as npimport torchfrom torch import nn#delimiter指定读取文件中数据的分割符 文件中的分割符是空格 就用空格xy = np.loadtxt('C:\\Users\\liuqian\\Desktop\\date\\diabetes.csv.gz',delimiter=',',dtype=np.float32)x_data = torch.from_numpy(xy[:,:-1]) #这里本来就是矩阵 y_data = torch原创 2021-04-29 16:33:54 · 473 阅读 · 0 评论 -
pytorch逻辑回归
import torchimport torch.nn.functional as F逻辑回归:在线性回归的基础之上再加上logist function 函数 把输出映射到【0,1】之间逻辑回归其实是分类x_data = torch.Tensor([[1.0],[2.0],[3.0]])y_data = torch.Tensor([[0],[0],[1]])class LogisticRegressionModel(torch.nn.Module): def __init__(se原创 2021-04-29 16:32:00 · 108 阅读 · 0 评论 -
pytorch-线性回归模型
线性回归模型构造损失函数构造计算图深度神经网络并没有太多的局部极小值,但是会有鞍点,鞍点就会导致没有梯度停止更新梯度下降的三种方式:SGD(随机梯度下降):每次更新只用一个样本,数据中会有噪声,会另训练离开鞍点,如果GD更新的话,进入鞍点就出不来了用SGD的话,loss function输出要进行平滑(否则看到的数据会跳动)GD(梯度下降):用所有样本的误差进行梯度更新。设定epoch次数。SGD有两个循环(每个样本都要遍历)而GD有一个循环mini-batch(常用方法)将数据分成一小原创 2021-04-29 16:17:25 · 314 阅读 · 1 评论 -
基础网络学习
1. LeNet-5如下图所示,Le-Net共有7层(不包括输入层),包含卷积层,下采样层(池化层)和全连接层。其输入图像的大小为32*32C1:卷积层C1层利用6个5*5的卷积核生成6个特征图。其步长为1且不使用扩充值,因此卷积后的特征图的尺寸为 28 * 28。一个卷积核的训练参数为5×5+1=265\times 5 +1 = 265×5+1=26,其中一个偏置参数。整个C1层的可训练参数为(5×5+1)×6=156(5\times 5+1)\times 6=156(5×5+1)×6=156原创 2021-04-29 16:01:23 · 266 阅读 · 0 评论 -
Fast R-CNN学习笔记
1.Fast R-CNN网络结构总体过程Fast R-CNN和R-CNN不同的是,R-CNN采用先生成建议框而后对每一个生成的建议框都利用CNN网络进行特征提取(CNN网络通过预训练-微调的方式训练参数);而Fast R-CNN借鉴SPP-Net网络结构,先是利用CNN网络对整个图像进行卷积特征提取,最后在卷积后生成的特征图中进行生成特征框(select search)。这样,每个图片中要生成2000个建议框,这样我们节省了1999次CNN推理运算。在解决输入图像大小改变的问题上,Fast原创 2021-04-29 15:55:15 · 102 阅读 · 0 评论 -
SPPNet学习笔记
R-CNN实现了卷积神经网络的提取特征,并将每个建议框分别送入深度网络来提取特征。但是这样存在一个问题,即输入尺寸必须是固定的(这是因为卷积神经网络输出的特征图的尺寸是固定的)。卷积神经网络通常由卷积部分和全连接部分构成。在卷积部分,对任意的图像的大小和卷积尺寸都能进行卷积操作,得到特征图;而在全连接部分,需要固定尺寸的输入。因此,固定尺寸的问题来自全连接层。然后对对于裁剪的方法会导致图像的失真。此外由于数千个建议框会有大量的重叠部分,将每个建议框分别送入深度网络进行特征提取的方法会造成大量的重复计算。原创 2021-04-02 17:11:58 · 147 阅读 · 0 评论 -
R-CNN学习笔记
参考文章:https://zhuanlan.zhihu.com/p/230061901.基础知识1.1 NMS有许多候选框预测是车,根据这些候选框是目标车的类别概率,找到最大概率的候选框,再利用其他的不是最大概率的候选框和最大概率的候选框做IOU丢弃IOU大于 设定阈值的候选框,最大的概率的候选框就是保留的候选框。再剩下候选框中再 选取最大概率的候选框再进行上述操作,找到所有被保留下来的矩形框。1.2 Selective Search:使用一种过分割手段,将图像分割成小区域 (1k~2k 个) 查原创 2021-04-02 14:06:27 · 100 阅读 · 0 评论 -
yolov4论文笔记
yolov4论文笔记yolov4论文主要总结了一些技巧,以及实验的效果。1.yolov4算法的效果:2.yolov4的trickyolov4使用了一些通用功能包括:Weighted-Residual-Connection(WRC)Cross-Stage-partial-connections(CSP)Cross mini-Batch Normalization (CmBN)Self-adversarial-training(SAT)Mish-acticvationMosaic dat原创 2021-04-02 10:22:35 · 237 阅读 · 0 评论 -
yolov1-v3学习报告
yolov1-v3学习报告1. yolov11.1网络结构 网络结构没有什么说的,看图就行。yolov1的结构是卷积神经网络,就是输入是一张448×448×3448\times 448\times 3448×448×3的图片最终输出7730的张量。 这里的7∗77*77∗7是将图分成了494949个方格区域。因为输出的张量是7×7×307\times 7\times 307×7×30的张量,说明每个方格后面都有303030维的向量。这30维数据包括两个框的信息,包括框的位置(x,y,这里原创 2021-04-02 10:13:19 · 322 阅读 · 0 评论 -
知乎mAP解释
作者:阿凿链接:https://www.zhihu.com/question/53405779/answer/429585383来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。我刚刚学到这个地方, 觉得自己应该差不多学明白了, 壮胆答一发 (第一次认真回答嘻嘻)本文绝对通俗易懂 :D明确问题: 大背景是object detection, 我就以正在学的RetinaNet应用背景为例, 识别出来的每一个框都有N+1个score, 对应着N个class和1个backgrou转载 2021-03-09 16:21:46 · 151 阅读 · 0 评论 -
MX350配置pytorch环境
1.电脑基本环境之前电脑里面下载的anaconda,显卡是MX3502. 下载cudaCUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序可以在支持CUDA™的处理器上以原创 2021-03-03 14:45:06 · 2068 阅读 · 2 评论 -
pycocotools包安装
pycocotools目前支持windows了。方法一:打开命令行输入:pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI但是这个我没有安装成功,估计是网不行。方法二下载安装包:https://pan.baidu.com/s/1K7GdcTnvTgmGh5LMyyqPkA提取码:ajdy解压以后,用命令行切换到D:\EdgeDownload\cocoapi-master\Pyth原创 2021-03-03 16:38:19 · 391 阅读 · 1 评论