吃瓜笔记---第五章神经网络

最新推荐文章于 2024-09-10 18:37:45 发布

deeplearningcc

最新推荐文章于 2024-09-10 18:37:45 发布

阅读量201

点赞数

文章标签：神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/deeplearningcc/article/details/127471118

版权

注：本文只是本人阅读西瓜书及南瓜书的阅读笔记和心得，可能只有自己能看懂，鉴于本人水平有限，有极大可能出现错误，欢迎读者批评指正

1、神经元模型

对上图单个神经元模型

输入={ $x_1,x_2...x_n$ }

输出 $y=f(\sum_{i=1}^{n}w_ix_i-\theta )$

w为权重， $\theta$ 为阈值， $f(\cdot )$ 为激活函数

2、感知机与多层网络

感知机（Perceptron）二类分类的线性模型，由两层神经元组成

感知机可以轻易的实现逻辑与、或、非运算

感知机的模型可以表示为：

$y=f(w^Tx-\theta )=\left\{\begin{matrix} 1, &w^Tx-\theta\geqslant 0; \\ 0, &w^Tx-\theta \leqslant 0. \end{matrix}\right.$

其中 $w^Tx-\theta$ 就是一个n维空间中的线性超平面，将n维空间分为两个部分。

单个感知机无法解决非线性可分问题，此时需要多层感知机来实现。

3、反向传播算法

反向传播算法基于梯度下降策略，即对于损失函数来说，沿着其梯度的方向减少可以是损失函数减少的速度最快。

因为神经网络不止一层，可能有多个隐藏层，此时定义网络在某一层的均方误差：

$E_k=\frac{1}{2}\sum_{j=1}^{l}(\hat{y}^k_j-y^k_j)^2$

同上述感知机的最小化损失函数的方法一样，沿着权重w的负梯度方向对其进行更新，因为神经网络包含多层，因此输入层的参数w求导会先对倒数第二层的参数求导，一层一层向前传播（链式求导法则）。

(后续补充。。。欢迎讨论)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

deeplearningcc CSDN认证博客专家 CSDN认证企业博客

码龄2年

10: 原创

146万+: 周排名

136万+: 总排名

3141: 访问

: 等级

101: 积分

0: 粉丝

1: 获赞

6: 评论

11: 收藏

私信

关注

热门文章

分类专栏

算法 1篇

最新评论

吃瓜笔记---第五章神经网络
CSDN-Ada助手: FastText是一个比较傻瓜的库，是否用过呢，好用么？
吃瓜笔记---第四章决策树
CSDN-Ada助手: 算法面试是否是有必要的呢？
吃瓜笔记---第三章线性模型
deeplearningcc: 把模型评估与选择中用于测试的数据集称为测试集，对机器学习误差评估的数据集称为测试集
吃瓜笔记---第三章线性模型
CSDN-Ada助手: 机器学习中验证集和测试集有什么区别？
吃瓜笔记---机器学习简介
CSDN-Ada助手: 你的文章很有意思，我觉得可以考虑这些改进，说不定有很好的效果，建议进行改进。具体如下：(1)使用标准目录；(2)文章不宜太短；(3)使用更多的站内链接。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。