神经网络与深度学习课程笔记（一）

最新推荐文章于 2023-03-20 21:57:46 发布

lhdskla

最新推荐文章于 2023-03-20 21:57:46 发布

阅读量63

点赞数

文章标签：深度学习神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lhdskla/article/details/129656024

版权

本文介绍了神经网络与深度学习的基础，包括线性回归、线性二分类问题、对数回归和多分类回归。讲解了线性回归的代价函数和求解方法，以及线性分类器与线性回归的区别。接着引入了Sigmoid函数在二分类问题中的应用，并概述了多层感知机和BP算法在解决线性不可分问题上的作用。

摘要由CSDN通过智能技术生成

线性回归

线性回归要素：训练集、输出数据和模型。

假设线性函数可表示为：

$y=h_{\theta}(x)=\theta^T x\\\theta=[\theta_1,\theta_2,...\theta_n]^T,x=[x_1,x_2,...x_n]^T$

给定样本 $x^{(i)},y^{(i)})$ ，构造代价(误差、损失)函数为：

$J(\theta)=\frac{1}{2}\sum_{i=1}^{m}(y^{(i)}-h_{\theta}(x^{(i)}))^{2}$

线性回归的目标是找到超平面参数 $\theta$ ，使 $J(\theta)$ 最小，即求解 $min_{\theta}J(\theta)$

令 $\frac{\partial J( \theta ) } { \partial \theta } = 0$ ，即可得到： $\theta = ( X ^ { T } X ) ^ { - 1 } X ^ { T } y$ ，其中：

$\left[ \begin{array} { l } { ( x ^ { ( 1 ) } ) ^ { T } } \\ { ( x ^ { ( 2 ) } ) ^ { T } } \\...\\ { ( x ^ { ( N ) } ) ^ { T } } \end{array} \right] , y = \left[ \begin{array} { l } { y ^ { ( 1 ) } } \\ { y ^ { ( 2 ) } } \\ ... \\{ y ^ { ( N ) } } \end{array} \right]$

线性二分类问题

线性分类器的输入是特征向量，输出是哪一类。如果是二分类问题，则为0和1，或者是属于某类的概率，即0-1之间的数。

与线性回归差别：

输出意义不同

属于某类的概率<->回归具体值

参数意义不同

最佳分类直线<->最佳拟合直线

维度不同

对于线性二分类问题，我们最终需要概率，结果在0-1之间，因此需要对值做一个变换：

$\frac { 1 } { 1 + e ^ { - z } }\\z=\theta^T x$

此函数称为Sigmoid函数。

同样地，可构造代价（误差）函数：

$J(\theta)=\frac{1}{2}\sum_{i=1}^{m}(y^{(i)}-\frac{1}{1+e^{-\theta^Tx^{(i)}}})^{2}$

和回归方程一致，只是加了S函数，因此又称作softmax回归。

目标仍然是找到超平面参数 $\theta$ ，使 $J(\theta)$ 最小，但是这里 $J$ 变成了非线性， $\frac{\partial J( \theta ) } { \partial \theta } = 0$ 无法求解。

采用迭代的方法，让 $\theta ) \rightarrow 0$ ，即构建一个序列，使 $\theta _ { 1 } , \theta _ { 2 } , \cdots \theta _ { k } \rightarrow \theta ^ { * }$ ，最简单的方式为：

$\theta _ { k + 1 } = \theta _ { k } + \Delta \theta _ { k }$

由于：

$\theta _ { k + 1 } ) = J ( \theta _ { k } ) + [ \frac { d J } { d \theta } ] ^ { T } \Delta \theta _ { k }$

若令：

$\Delta \theta _ { k } = - \alpha \frac { d J } { d \theta } = - \alpha \triangledown _ { \theta } J$

则必然有 $\theta _ { k + 1 } ) \leq J ( \theta _ { k } )$

在这里插入图片描述

对数回归与多分类回归

从概率角度看问题。二分类问题可使用条件概率描述:

在这里插入图片描述
假设输出为{0,1}。重新修改指标函数：

在这里插入图片描述

神经元模型

在这里插入图片描述
单神经元模型

在这里插入图片描述

多层感知机

线性不可分问题：无法进行线性分类，解决方法为使用多层感知机：在输入和输出层间加一或多层隐单元。

在这里插入图片描述

多层前馈网络

多层前馈网络的反向传播（BP）学习算法，简称BP算法，是有导师的学习，它是梯度下降法在多层前馈网中的应用。网络结构见下图：

在这里插入图片描述

已知网络的输入/输出样本，即导师信号
BP学习算法由正向传播和反向传播组成

BP算法

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

lhdskla CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

166万+: 周排名

137万+: 总排名

204: 访问

: 等级

40: 积分

1: 粉丝

0: 获赞

4: 评论

0: 收藏

私信

关注

热门文章

最新评论

神经网络与深度学习课程笔记（三）
CSDN-Ada助手: 恭喜您写了第三篇博客，标题看起来非常有意思！很高兴能够看到您分享神经网络与深度学习课程的笔记，我相信这对于正在学习这个领域的读者来说非常有帮助。希望您能够继续保持创作，分享更多有价值的内容，特别是对于实践应用方面的经验和见解。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
神经网络与深度学习课程笔记（四）
CSDN-Ada助手: 非常感谢用户持续分享神经网络与深度学习课程笔记，这对学习者来说是非常有价值的。希望用户能够继续保持写作的热情和耐心，不断总结和分享自己的学习经验和心得体会。下一步的创作建议是可以尝试结合实际案例进行分析和探讨，让读者更加深入地理解神经网络与深度学习的应用场景和实际效果。再次感谢用户的分享，期待更多优秀的文章。 CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
神经网络与深度学习课程笔记（二）
CSDN-Ada助手: 常用的神经网络模型有哪些，各自有什么特点？
神经网络与深度学习课程笔记（一）
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(2)使用标准目录；(3)使用更多的站内链接。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。