2022吴恩达机器学习（Deep learning）课程对应笔记24：训练神经网络

最新推荐文章于 2024-08-29 09:45:37 发布

bubu-_

最新推荐文章于 2024-08-29 09:45:37 发布

阅读量246

点赞数

分类专栏： 2022吴恩达最新机器学习课程文章标签：机器学习深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/airuohan_/article/details/129697441

版权

2022吴恩达最新机器学习课程专栏收录该内容

28 篇文章 7 订阅

订阅专栏

笔记介绍了神经网络训练的步骤，包括使用Sequential构建模型，选用二元交叉熵作为损失函数，通过梯度下降更新参数。讨论了逻辑回归模型，以及不同类型的激活函数，如ReLU、Sigmoid和线性激活函数，强调了ReLU在隐藏层的常见使用及其优势。

摘要由CSDN通过智能技术生成

2022吴恩达机器学习（Deep learning）课程对应笔记24

神经网络训练

更新时间：2023/03/21

在这里插入图片描述

继续以手写数字识别问题为例：

第一步是以Sequential的方式定义模型
第二步是指定loss function是什么，这里用的是二元交叉熵函数
第三步是开始开始训练模型，epoch是训练模型的轮数

在这里插入图片描述

模型训练细节

在这里插入图片描述

下面讲解一下逻辑回归模型的具体训练步骤：

确定模型的输入特征x和对应的参数 $w$ 和 $b$ ，计算模型的输出，也就是计算 $f_{\vec{w},b}(\vec{x})=?$
指定模型具体的loss和代价函数，loss指的是一个样本的估计值与真实值之差，代价函数指的整个数据集中所有样本各自的估计值与真实值之间的差。
- $loss=L(f_{\vec{w},b}(\vec{x}), y)$
- $J(\vec{w},b)=\frac{1}{m}\sum_{i=1}^{m}L(f_{\vec{w},b}(\vec{x}), y)$
训练数据更新参数，最小化 $J(\vec{w},b)$
- $w=w-\alpha*dj\_dw$
- $b=b-\alpha*dj\_db$

对比神经网络的学习过程如下

$model = Sequential{...}$
$m o d e l . co m p i l e (l oss = C rosse n t ro p y ())$
$m o d e l . f i t (X, y, e p oc h s = 100)$

下面具体看每一步

第一步创建模型

在这里插入图片描述

第二步确定Loss和代价函数

分类用交叉熵loss，回归用平方误差loss
在这里插入图片描述

第三步训练：梯度下降

在这里插入图片描述
不同的深度学习框架

在这里插入图片描述

激活函数的替代方案

在这里插入图片描述

一个常见的激活函数：
$ReLU=max(0,Z)=max(0,\vec{w}\vec{x}+b)$

在这里插入图片描述

下面不同的激活函数

线性激活函数： $g (z) = z$
Sigmoid激活函数： $g(z)=\frac{1}{1+e^{-z}}$
ReLU激活函数： $g(z)=max(0,z)=max(0,\vec{w}\vec{x}+b)$

在这里插入图片描述

如何选择激活函数

在这里插入图片描述
对于输出层的激活函数选择：

根据具体的任务而定：
1. 对于分类任务一般会用sigmoid激活函数。
2. 对于线性回归问题一般选择线性激活函数。
3. 对于 $\hat{y}$ 只能取正值，毫无疑问选择ReLU激活函数。

在这里插入图片描述

对于隐藏层的激活函数选择：目前为止ReLU是最常用的选择（）

选择ReLU的原因：
1. 因为计算速度快。
2. sigmoid有两个梯度很平缓的区间，梯度下降会很慢，而ReLU则只有一个平缓的地方

在这里插入图片描述

小结一下激活函数的选择

在这里插入图片描述

为什么模型需要激活函数

在这里插入图片描述

对于线性回归来说有没有激活函数都可以
但是如果没有激活函数，神经网络模型就只能解决线性模型，无法处理其它类型的模型

在这里插入图片描述

在这里插入图片描述

不要在隐层用线性激活函数

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2022吴恩达机器学习（Deep learning）课程对应笔记24：训练神经网络

2022吴恩达机器学习（Deep learning）课程对应笔记24。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。