![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
动手学深度学习
文章平均质量分 82
irober
这个作者很懒,什么都没留下…
展开
-
《深度学习》之 循环神经网络 原理
《深度学习》之 循环神经网络 原理 超详解一、简介二、结构3.1 循环结构3.2 RNN 结构三、训练算法四、基于 RNN 的语言模型例子1、首先,要把词表达为向量的形式:2、为了输出 “最可能” 的词,所以需要计算词典中每个词是当前词的下一个词的概率,再选择概率最大的那一个。3、为了让神经网络输出概率,就要用到 softmax 层作为输出层。参考:https://blog.csdn.net/DFCED/article/details/104982539https://www.jianshu.com/转载 2021-02-05 15:37:43 · 386 阅读 · 0 评论 -
Pytorch矩阵乘法之torch.mul() 、 torch.mm() 及torch.matmul()的区别
torch.mul() 、 torch.mm() 及torch.matmul()的区别一、简介torch.mul(a, b) 是矩阵a和b对应位相乘,a和b的维度必须相等,比如a的维度是(1, 2),b的维度是(1, 2),返回的仍是(1, 2)的矩阵;torch.mm(a, b) 是矩阵a和b矩阵相乘,比如a的维度是(1, 2),b的维度是(2, 3),返回的就是(1, 3)的矩阵。torch.bmm() 强制规定维度和大小相同torch.matmul() 没有强制规定维度和大小,可以用利用广原创 2021-02-05 12:27:46 · 29563 阅读 · 4 评论 -
《动手学深度学习Pytorch版》之DenseNet代码理解
《动手学深度学习Pytorch版》之DenseNet代码理解一、模块介绍1、卷积块conv_block2、稠密块DenseBlock3、过渡块transition_block二、DENSNET模型1、DenseNet首先使用同ResNet⼀样的单卷积层和最大池化层2、 DenseNet使用4个稠密块3、同ResNet⼀样,最后接上全局池化层和全连接层来输出稠密块由多个 conv_block 组成,每块使⽤相同的输出通道数。但在前向计算时,我们将每块的输⼊和输出在通道维上连结。一、模块介绍1、卷积块co原创 2021-02-04 11:34:28 · 1384 阅读 · 0 评论 -
《动手学深度学习Pytorch版》之批量归一化理解与可视化
《动手学深度学习Pytorch版》之批量归一化对深层神经⽹络来说,即使输⼊数据已做标准化,训练中模型参数的更新依然很容易造成靠近输出层输出的剧烈变化。在模型训练时,批量归⼀化利⽤⼩批量上的均值和标准差,不断调整神经⽹络中间输出,从⽽使整个神经⽹络在各层的中间输出的数值更稳定。一、预备知识1、分为三类对全连接层做批量归一化数据输入(二维):(batch_size,n_feature)数据输出(二维):(batch_size,n_feature)计算均值和方差mean = X.mea原创 2021-02-03 11:58:43 · 366 阅读 · 0 评论 -
《动手学深度学习Pytorch版》之GoogLeNet
《动手学深度学习Pytorch版》之GoogLeNetGoogLeNet中的基础卷积块叫作Inception块class Inception(nn.Module): # c1 - c4为每条线路里的层的输出通道数 def __init__(self, in_c, c1, c2, c3, c4): super(Inception, self).__init__() # 线路1,单1 x 1卷积层 self.p1_1 = nn.Conv2d(原创 2021-02-02 19:26:14 · 116 阅读 · 0 评论 -
《动手学深度学习Pytorch版》之Pytorch常用操作
未完待续。。。。。GPU操作二、模型保存读取操作1、访问模块模型参数model.parameters()一个从参数名称隐射到参数Tesnor的字典对象state_dict举例1import torchfrom torch import nnnet = MLP() #这里我省略了MLP()的定义,详见《动手学习深度学习Pytorch》对应章节net.state_dict()输出1class MLP(nn.Module):...OrderedDict([('hidden.原创 2021-02-01 21:03:17 · 406 阅读 · 0 评论 -
jupyter notebook远程服务器使用gym
jupyter notebook中使用gymjupyter notebook中使用gym莫烦pytorch系列教程 4.5 DQN 强化学习 (PyTorch tutorial 神经网络 教学),使用到gym。Gym是一个用于测试和比较强化学习算法的工具包,它不依赖强化学习算法结构,并且可以使用很多方法对它进行调用,像Tensorflow。目前我使用Ubuntu远程服务器,配合Vscode的jupyter notebook进行远端调试。安装gym!pip install -i https://p转载 2021-01-29 15:45:20 · 1482 阅读 · 1 评论 -
MXNet双向循环神经网络----单个隐藏层的双向循环神经网络(程序)
MXNet双向循环神经网络----单个隐藏层的双向循环神经网络(程序)《动手学深度学习》第六章 第10节的练习题,个人解答。下图演示了一个含单隐藏层的双向循环神经网络的架构。下面我们来介绍具体的定义。给定时间步ttt的小批量输入Xt∈Rn×d\boldsymbol{X}_t \in \mathbb{R}^{n \times d}Xt∈Rn×d(样本数为nnn,输入个数为ddd)和隐藏层...原创 2020-04-24 15:16:03 · 511 阅读 · 0 评论 -
MXNet深度循环神经网络----含有2个隐藏层的循环神经网络(程序)
MXNet深度循环神经网络----含有2个隐藏层的循环神经网络(程序)《动手学深度学习》第六章 第9节的练习题,个人解答。在深度学习应用里,我们通常会用到含有多个隐藏层的循环神经网络,也称作深度循环神经网络。下图演示了一个有LLL个隐藏层的深度循环神经网络,每个隐藏状态不断传递至当前层的下一时间步和当前时间步的下一层。具体来说,在时间步ttt里,设小批量输入Xt∈Rn×d\boldsymb...原创 2020-04-24 15:02:41 · 1221 阅读 · 0 评论 -
Fashion-mnist数据的读取与保存
Fashion-mnist数据的读取与保存图像分类数据集(Fashion-MNIST)一、获取数据集1.1 方法一1.2 方法二二、显示数据2.1 方法一2.2 方法二三、保存数据四、读取小批量4.1 方法一4.2 方法二小结图像分类数据集(Fashion-MNIST)一、获取数据集首先导入本节需要的包或模块。%matplotlib inlineimport d2lzh as d2lf...原创 2020-03-30 19:11:14 · 5652 阅读 · 1 评论