（Pytorch）动手学深度学习：基础内容（持续更新）

孔表表uuu

已于 2023-10-24 16:06:00 修改

阅读量227

点赞数 5

分类专栏：神经网络文章标签：深度学习 pytorch 人工智能

于 2023-10-18 11:59:04 首次发布

本文链接：https://blog.csdn.net/cynic233/article/details/133896489

版权

神经网络专栏收录该内容

3 篇文章 0 订阅

订阅专栏

深度学习

前言

之前看吴恩达老师的深度学习视频知道了不少专业名词，但是并不明白是什么，怎么用。
这次又看了李沐老师的动手学深度学习课程，理论+代码的方式让我受益匪浅。
课程地址：https://www.bilibili.com/video/BV1if4y147hS/?spm_id_from=333.337.search-card.all.click
下面所写仅为记录自己学习的过程遇到的觉得比较重要的知识点，如有错误请指正。

环境安装(Windows)

安装anaconda

安装链接

使用conda或miniconda创建环境

# 如果之前创建过则先移除之前的环境
conda env remove d2l-zh
# 创建虚拟环境并下载解释器
conda create -n d2l-zh python=3.8
# 激活刚刚创建的环境
conda activate d2l-zh

下载所需的包

pip install -y jupyter d2l torch torchvision

下载代码并执行(课件代码)

注意：这里的wget、unzip命令都是linux中的命令，可以直接去下面的网站里下，也可以用Wget for Windows 下载

# 下载
wget https://zh-v2.d2l.ai/d2l-zh.zip
# 解压
unzip d2l-zh.zip
# 使用jupyter
jupyter notebook

关于线性代数

内积(数量积、点乘)

外积

关于数据操作

X.sum(0, keepdim=True) 和 X.sum(1, keepdim=True)

X.sum(0) 为按第0维求和，即按列求和
X.sum(1) 为按第1维求和，即按行求和
keepdim参数为是否保持X原本的维度

例如：

X = torch.tensor([[1.0, 2.0, 3.0],[4.0, 5.0, 6.0]])

即
$\begin{bmatrix} 1.0&2.0&3.0\\ 4.0&5.0&6.0\\ \end{bmatrix}$
按行分出两个向量并按列求和
$X_{row=1} = \begin{bmatrix} 1.0&2.0&3.0\\ \end{bmatrix} \\ X_{row=2} = \begin{bmatrix} 4.0&5.0&6.0\\ \end{bmatrix} \\ X.sum(0, keepdim=True) = X_{row=1}+X_{row=2}= \begin{bmatrix} 5.0&7.0&9.0\\ \end{bmatrix}$
由于参数keepdim=True则X.sum的结果的维度与X本身的维度相同即 [ [ 5.0 7.0 9.0 ] ]

例如：

X = torch.tensor([[1.0, 2.0, 3.0],[4.0, 5.0, 6.0]])

即
$\begin{bmatrix} 1.0&2.0&3.0\\ 4.0&5.0&6.0\\ \end{bmatrix}$
按行分出三个向量并按行求和
$X_{col=1} = \begin{bmatrix} 1.0&4.0\\ \end{bmatrix}^T \\ X_{col=3} = \begin{bmatrix} 3.0&6.0\\ \end{bmatrix} ^T \\ \\ X_{col=2} = \begin{bmatrix} 2.0&5.0\\ \end{bmatrix} ^T \\ X.sum(1, keepdim=True) = X_{col=1}+X_{col=2}+X_{col=3}= \begin{bmatrix} 6.0&15.0\\ \end{bmatrix}$
由于参数keepdim=True则X.sum的结果的维度与X本身的维度相同即 [ [ 6.0 15.0 ] ]

广播机制(broadcast)

什么是广播机制？

如过两个数组做运算，数组的形状不同，则会自动转换成相同的数组的形状进行运算，小一点的数组适应大的数组

在这里插入图片描述
图片出处

广播机制条件
1.
2.
广播机制运算

例如：
$\begin{bmatrix} 0&0&0\\ 1&1&1\\ 2&2&2\\ \end{bmatrix} + \begin{bmatrix} 1&2&3\\ \end{bmatrix} \iff \begin{bmatrix} 0&0&0\\ 1&1&1\\ 2&2&2\\ \end{bmatrix} + \begin{bmatrix} 1&2&3\\ 1&2&3\\ 1&2&3\\ \end{bmatrix} = \begin{bmatrix} 1&2&3\\ 2&3&4\\ 3&4&5\\ \end{bmatrix}$
先把维度较小的tensor的维度扩充到和较大维度的tensor的维度一致，即先把[1 2 3]向量扩充成[[1 2 3], [1 2 3], [1 2 3]]然后再进行运算

Softmax函数和交叉熵损失函数

Softmax函数

公式：
$softmax(X_{ij}) = \frac{\exp(X_{ij})}{\sum_{k}\exp(X_{ik})}$

交叉熵损失函数

多分类公式：
$-\sum_{i=1}^{n}{y_i\log[softmax(X)]} = -\log \hat{y_y}$
其中，n为输出维度（分类个数），y为真是label的概率（one-hot），L反应的是真实值和预测值的差距

感知机

公式：
$\omicron = \sigma(<\textbf{W}, \textbf{X}> + b) \qquad \sigma(x) =\begin{cases} 1, & if \ x > 0 \\ 0, & otherwise \end{cases}$

多层感知机

孔表表uuu

关注

5
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
（Pytorch）动手学深度学习：基础内容（持续更新）

之前看吴恩达老师的深度学习视频知道了不少专业名词，但是并不明白是什么，怎么用。这次又看了李沐老师的动手学深度学习课程，理论+代码的方式让我受益匪浅。课程地址：https://www.bilibili.com/video/BV1if4y147hS/?下面所写仅为记录自己学习的过程遇到的觉得比较重要的知识点，如有错误请指正。
复制链接

扫一扫