李沐《动手学深度学习》学习笔记（一）

最新推荐文章于 2024-04-22 14:48:43 发布

m0_46457452

最新推荐文章于 2024-04-22 14:48:43 发布

阅读量350

点赞数

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46457452/article/details/129663648

版权

一、线性神经网络

回归是能为一个或多个自变量与因变量之间建模的一类方法。其主要包括线性回归与softmax回归。线性回归的输出往往是预测一个连续值，而softmax回归虽然叫做回归，但其实是一个分类任务，其输出往往是预测一个离散的值。

1:线性回归

线性回归最经典的例子便是预测房价了，根据样本的特征数量，分别给予不同的权重，再加上一个偏置项，来表达我们的预测模型。线性模型的具体形式如下：

机器学习的任务便是寻找一组最好的模型参数w与b，但为了完成这个任务，我们需要两件工具。一是评估模型的度量方式；二是可以更新模型以提高预测质量的方法。

（1）：损失函数

损失函数的任务便是上述第一个工具，它能量化目标的实际值与预测值之间的差距。其形式如下：

训练模型时，我们希望寻找一组参数w与b能够最小化所有训练样本上的总损失。

（2）：最小化损失函数的解法

求解方式有两种方法：正规方程法与梯度下降法。

正规方程法对问题的限制很严格，无法广泛应用于深度学习中，更常用的是梯度下降法。值得一提的是，梯度下降法恰恰便是上述的第二个工具，它可以更新参数。

2:softmax回归

在现实生活中，我们往往还会面对这一类问题，对于给定的输入，例如不同的图像，我们只想知道图像属于哪一类，这便是softmax回归。与线性回归不同，我们的任务是给与它一个标签。

为了在数学形式上表示我们的分类问题，统计学家给出了一种表示分类数据的简单方法：独热编码。

对于一个小批量的样本X，其中特征维度为的d，批量大小为n。其矢量计算表达式为：

可是，在这个形式下，我们的输出会是一个个无法与概率联系起来的值。因此我们需要一种变换方式，将输出变为概率。它得保证任何数据上的输出都非负，且总和为1。这一变换方法便是softmax运算。

因此，我们的模型变为：

（1）：损失函数

与线性回归一样，我们需要一个损失函数来度量模型的好坏。在softmax回归任务中，它的形式为：

它也通常被称为交叉熵损失。

求解最小化损失函数的方法依然是梯度下降法。

二、多层感知机

最简单的深度网络就叫做多层感知机。以softmax回归作为对比，它是一个单层的神经网络。输入层直接连接到输出层。

而多层感知机与之不同的地方在于，它加入了隐藏层。对于加入隐藏层的原因我们不做深入探讨，但加入隐藏层后的影响与变化我们需要仔细研究。

若是只单纯的添加隐藏层，新的模型似乎对我们没有任何好处，因为它不仅为我们带来了更多的参数，而且只需要合并隐藏层，他便可以等价于一个单层网络！为了发挥它的价值，我们需要在每一次仿射变换后添加一个激活函数。有了他的存在，多层感知机便不能退化成线性模型了。

常用的激活函数是ReLU函数，它被称作修正线性单元。

它的函数图像长这样：

使用ReLU的一个重要原因是，它的求导表现特别好，这减轻了神经网络的梯度消失问题。

未完待续。。。

注：本文所有图片均来自于此书《动手学深度学习》

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
李沐《动手学深度学习》学习笔记（一）

若是只单纯的添加隐藏层，新的模型似乎对我们没有任何好处，因为它不仅为我们带来了更多的参数，而且只需要合并隐藏层，他便可以等价于一个单层网络！线性回归的输出往往是预测一个连续值，而softmax回归虽然叫做回归，但其实是一个分类任务，其输出往往是预测一个离散的值。在现实生活中，我们往往还会面对这一类问题，对于给定的输入，例如不同的图像，我们只想知道图像属于哪一类，这便是softmax回归。线性回归最经典的例子便是预测房价了，根据样本的特征数量，分别给予不同的权重，再加上一个偏置项，来表达我们的预测模型。
复制链接

扫一扫

m0_46457452 CSDN认证博客专家 CSDN认证企业博客

码龄4年

4: 原创

175万+: 周排名

159万+: 总排名

896: 访问

: 等级

45: 积分

0: 粉丝

0: 获赞

2: 评论

1: 收藏

私信

关注

热门文章

最新评论

李沐《动手学深度学习》学习笔记（三）
CSDN-Ada助手: 恭喜您写的第三篇博客！我看了您的学习笔记，感觉非常有收获，特别是对李沐的《动手学深度学习》有了更深入的理解。我建议您在下一篇博客中可以结合自己的实践经验，分享一些在深度学习领域中遇到的问题和解决方法。期待您的下一篇文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
李沐《动手学深度学习》学习笔记（四）
CSDN-Ada助手: 非常感谢您对深度学习的学习和分享，您的第四篇博客《李沐《动手学深度学习》学习笔记（四）》又让我们受益匪浅。恭喜您能够坚持写作，我期待着您未来更多的优秀文章。如果可能的话，我建议您可以适当增加一些实践案例和经验分享，这样会更加丰富和实用。感谢您的分享，期待您的下一篇作品。 CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。