Standford机器学习神经网络的学习（Neural Network Learning）

最新推荐文章于 2024-07-31 18:25:57 发布

Jackie_Zhu

最新推荐文章于 2024-07-31 18:25:57 发布

阅读量2.9k

点赞数 2

分类专栏：机器学习机器学习文章标签：机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jackie_zhu/article/details/8977055

版权

本文介绍了神经网络的学习过程，包括权重矩阵Theta的优化、反向传播算法用于计算梯度，以及随机初始化策略以避免模型退化。在分类问题中，神经网络的输出层神经元数量取决于类别数。通过前向传播计算activation，再利用反向传播算法计算误差和delta，从而更新梯度。为了验证梯度计算的正确性，还提及了梯度校验的方法。此外，文章强调了随机初始化Theta的重要性，以避免所有theta相同导致的模型问题。

摘要由CSDN通过智能技术生成

上一讲讲了神经网络的表示，神经网络中，从前一层映射到后一层的需要有个一个权重矩阵Theta和激活函数，映射后可以得到该层神经元的activation。如何来学习Theta是本讲要解决的内容。

首先，对于一个分类问题，如果是两类问题，输出层只需要有一个神经元，输出1为正类，输出0为负类。而对于多类的问题，需要有多个神经元。定义一个神经网络，如下：

它的输出是一个向量，如图，假设要分成4类，向量的对应类别下标为1，输出可以表示成

根据上一讲神经网络的表示，和逻辑回归的估价函数类似（神经网络就是把每个神经元的估价函数相加得到的），可以得出如下的估价函数

最低0.47元/天解锁文章

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。