Linear Regression 线性回归 & Softmax 分类模型 & 多层感知机

最新推荐文章于 2024-05-18 10:19:38 发布

qq_41417206

最新推荐文章于 2024-05-18 10:19:38 发布

阅读量351

点赞数

分类专栏： Deep Learning

本文链接：https://blog.csdn.net/qq_41417206/article/details/104270308

版权

本文介绍了线性回归的概念，包括全连接层的权重和偏置参数形状；深入讲解了Softmax回归，阐述了softmax函数的作用及小批量样本的计算过程，以及交叉熵损失函数的运用；最后探讨了多层感知机（MLP），解释了隐藏层、ReLU激活函数以及如何从零开始实现MLP模型。

摘要由CSDN通过智能技术生成

线性回归课后题

全连接层和输入输出形状

假如你正在实现一个全连接层，全连接层的输入形状是7×8，输出形状是7×1，其中7是批量大小，则权重参数w和偏置参数b的形状分别是____和____

输入为 $X∈R^{7×8}$ ，输出为 $Y∈R^{7×1}$ ，权重参数为 $w∈R^8×1$ ，则 $X_w∈R^{7×1}$ 。
给 $X_w$ 中的每个元素加上的偏置是一样的，所以偏置参数 $b∈R^{1×1}$ 。(参数的形状与批量大小没有关系)

broadcasting semantics

计算：

# y为nx1
>>> y=torch.randn(4)
>>> y
tensor([-1.4736, -0.7209,  0.6472,  1.0759])
>>> y_hat.view(-1).shape # A选项正确
torch.Size([4]) 

# y_hat为1xn
>>> y_hat=torch.randn(4,1)
>>> y_hat
tensor([[1.2142],
        [1.7063],
        [0.4449],
        [0.9576]])
>>> y.view(-1).shape # B选项错误：前者是4x1，后者是1x4
torch.Size([4])
>>> y.view(y_hat.shape).shape # C选项正确
torch.Size([4, 1])
>>> y.view(-1, 1).shape # D选项正确
torch.Size([4, 1])

tensor的.shape/.size 都是返回形状

# .shape和.size()方法返回值一致
x=torch.randn(4)
>>> x
tensor([-0.0233, -0.4144, -0.5163, -0.8312])
>>> x.shape
torch.Size([4])
>>> x.size()
torch.Size([4])

在线性回归模型中，对于某个大小为3的批量，标签的预测值和真实值如下表所示：

$\hat{y}$	$y$
2.33	3.14
1.07	0.98
1.23	1.32

该批量的损失函数的平均值为：0.112

# 用教程里的函数计算一下
>>> import torch
>>> y=torch.tensor([3.14, 0.98, 1.32])
>>> y_hat=torch.tensor([2.33, 1.07, 1.23])
>>> def squared_loss(y_hat, y):
...     return (y_hat - y.view(y_hat.size())) ** 2 / 2
... 
>>> loss=squared_loss(y_hat, y)
>>> loss
tensor([0.3281, 0.0041, 0.0041])
>>> loss.mean()
tensor(0.1121)

Softmax回归的基本概念

Softmax单层神经网络
softmax是一个单层神经网络，输出层也是一个全连接层：
每个输出 $o_1, o_2, o_3$ 的计算都要依赖于所有的输入 $x_1, x_2, x_3, x_4$ 。

将输出值变换成值为正且和为1的概率分布：
$\text{softmax}(o) = \frac{ \exp(o)}{\sum_i \exp(o_i)}$

单样本与小批量softmax矩阵运算

计算表达式： $\begin{aligned} \boldsymbol{o}^{(i)} &= \boldsymbol{x}^{(i)} \boldsymbol{W} + \boldsymbol{b},\\ \boldsymbol{\hat{y}}^{(i)} &= \text{softmax}(\boldsymbol{o}^{(i)}). \end{aligned}$

权重、偏差参数：

最低0.47元/天解锁文章

qq_41417206

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Linear Regression 线性回归 & Softmax 分类模型 & 多层感知机

线性回归课后题全连接层和输入输出形状假如你正在实现一个全连接层，全连接层的输入形状是7×8，输出形状是7×1，其中7是批量大小，则权重参数w和偏置参数b的形状分别是____和____输入为X∈R7×8X∈R^{7×8}X∈R7×8，输出为Y∈R7×1Y∈R^{7×1}Y∈R7×1，权重参数为w∈R8×1w∈R^8×1w∈R8×1，则Xw∈R7×1X_w∈R^{7×1}Xw∈R7×...
复制链接

扫一扫