1.2 前向反向传播，多层感知机，回归，分类

最新推荐文章于 2024-07-12 13:30:32 发布

遨游天地间

最新推荐文章于 2024-07-12 13:30:32 发布

阅读量113

点赞数

分类专栏：深度学习文章标签：回归分类数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A_liwenqian/article/details/134424531

版权

深度学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

前向传播和反向传播

输入层，隐藏层，输出层之间是怎样流动的

前向传播

在这里插入图片描述
神经网络运行跳层

Wh 权重， Hprev 前一层输出， Bh 偏置， h 本层输出
y 最后输出

损失函数

神经网络训练往往以随机参数开始， 初始输出结果不好，训练过程中经常用损失函数衡量预测结果和真实结果的差距
在这里插入图片描述第i个样本的真实结果

在这里插入图片描述模型预测输出值

蓝色是预测值，误差累加和求平均就是均方误差。损失可以评估网络性能，希望通过训练使 MSE 尽可能小，因此需要找到方法有效的不断更新网络权重和偏置，是损失函数不断减小，就是反向传播算法 与梯度下降算法

在这里插入图片描述

反向传播(Back Propagation)

梯度：偏导数

使用链式法则，从最后的损失函数开始，逐层往前计算各个神经元的权重和偏置，这些模型参数的偏导数，构成损失函数对权值的梯度作为进一步修改模型参数的依据
在这里插入图片描述

反向传播原理

理解原理

Xj 所有链接的加权和
每个神经元和分 2部分，前面是线性组合，后面是激活函数

神经网络训练的目标是找到一组权重参数 w 能够确保任何一个输入向量产生的输出向量 Yj 都能和想要的目标输出向量完全一样或足够接近

在这里插入图片描述

最小化损失函数

在这里插入图片描述

在这里插入图片描述左边例子的网络预测输出

在这里插入图片描述样本类别的真实值
所有训练的样本输出神经元的索引
E 总损失，使E 最小的参数就是我们需要的，求助最优化方法来求解，通过求权重的偏导数，逐步逼近求解

通过这种方式，把机器学习问题转换成最优化问题

链式法则

这部分不熟悉补充机器学习或数值计算其中最优化部分的知识

接下来怎样去计算

一层层向后求导数

在这里插入图片描述
先求和

在这里插入图片描述

通过链式法则把最后一层的误差总损失传递到倒数第二层，反复重复这个步骤，就能得到前面所有隐藏层的偏导数，也能对前面各层的参数进行求偏导的计算，有了偏导计算的公式后根据梯度下降法更新神经网络的参数

小结

![在这里插入图片描述](https://img-blog.csdnimg.cn/618440e1c6bc47bdae8119e9e82a0748.png ==600x)
前向传播传递的是数据，信息

反向传播传递的是误差，梯度，偏导数，用偏导数更新模型参数

多层感知机代码实现

PyTorch搭建神经网络

在这里插入图片描述

回归问题

一元线性回归

找到哪一条最好最优化问题
点到线的距离
在这里插入图片描述

曼哈顿距离绝对值
欧氏距离平方和

民主投票

反向运算

找出 k,b 使结果最小，衡量了误差的大小

在这里插入图片描述

凸优化：函数可导的概念

找到最优参数

多元线性回归

x 变成向量

在这里插入图片描述
横坐标 X 是高纬度的

X是矩阵， m 是样本的个数， n 特征维度
在这里插入图片描述
行乘列

机器学习

目标函数最优化

多元线性回归的正规方程解

在这里插入图片描述

多项式回归

在这里插入图片描述

求所有样本点到这条线距离的和

先算出目标函数，在通过最优化方法求使得它最小的参数，最终得到一条线（模型）

小结

在这里插入图片描述

分类问题

分类任务的定义

将输入数据集划分到一个或多个类别中的过程
类别是事先确定的，并且类别标签是已知的
输出是一个离散的类别标签，而不是连续的值

机器学习算法流程

在这里插入图片描述

多分类问题的数学表示

向量表示
缺点：类别数量大时，特征维度数量特别高在这里插入图片描述

概率表示
在这里插入图片描述

softmax回归

多项式逻辑回归，可以输出多个类别的概率

优点：将输入特征向量转化为概率值

在这里插入图片描述

损失函数

在这里插入图片描述

对数损失函数

i 类别的编号

单调性，结合性多个数乘积转换为和的形式，放缩性

在这里插入图片描述

交叉熵损失函数

m 样本数， n 所属不同类别的个数
在这里插入图片描述

小结

在这里插入图片描述

遨游天地间

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
1.2 前向反向传播，多层感知机，回归，分类

将输入数据集划分到一个或多个类别中的过程类别是事先确定的，并且类别标签是已知的输出是一个离散的类别标签，而不是连续的值。
复制链接

扫一扫

专栏目录

遨游天地间 CSDN认证博客专家 CSDN认证企业博客

码龄5年

24: 原创

110万+: 周排名

20万+: 总排名

1万+: 访问

: 等级

265: 积分

153: 粉丝

14: 获赞

16: 评论

101: 收藏

私信

关注

热门文章

分类专栏

深度学习 5篇
文献科研 3篇
FPGA 4篇
IC验证 10篇
Git指令详解 1篇

最新评论

win11配置CUDA+cuDNN+Anaconda+Miniconda+Pytorch+yolov5
CSDN-Ada助手: 恭喜您完成了第18篇博客“YOLOv5环境配置安装”！您的持续创作精神令人钦佩。接下来，可以考虑写一些关于YOLOv5的实际应用案例或者优化方法，这样能够为读者提供更多实用的内容。期待您的下一篇作品！加油！
Vscode基本使用方法
CSDN-Ada助手: 恭喜您撰写了第19篇博客！标题“Vscode基本使用方法”听起来非常有用。您的文章对于那些想要更好地利用Vscode的人来说一定是一份宝贵的指南。不过，我也希望能看到您进一步探索Vscode的高级功能，例如如何使用插件进行自定义设置，或者分享一些实用的快捷键技巧。谦虚地说，我相信这样的内容将更进一步丰富您的博客，并帮助更多的读者更好地使用Vscode。期待您的下一篇创作！
利用 HistCite快速定位关键文献
简单简单小白: 感谢博主的优质好文，文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，期待博主持续带来更多好文！
2.1.3 -1【验证计划、进程评估】
CSDN-Ada助手: 恭喜你写完了第15篇博客！你的持续创作真是令人钦佩。标题中的验证计划和进程评估听起来很有深度，我期待着读到你的观点和见解。在下一步的创作中，也许你可以考虑分享一些实践经验或者案例分析，这样读者能更好地理解和应用你的知识。谢谢你的分享，期待你未来更多精彩的博客！
【高效文献调研】
CSDN-Ada助手: 恭喜您撰写第16篇博客，题为"【高效文献调研】"！您对文献调研的高效方法进行了精彩的探讨，为读者提供了宝贵的参考。在接下来的创作中，或许您可以探索一些实践案例，以进一步加强读者对高效文献调研的理解。谦虚地说，我相信您的经验和见解将继续为我们带来启发。期待您的下一篇博客！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。