Andrew Ng Machine Learning 专题【Neural Networks】下

最新推荐文章于 2021-01-27 01:28:00 发布

IronYoung

最新推荐文章于 2021-01-27 01:28:00 发布

阅读量3.1k

点赞数 1

分类专栏： Machine Learning Machine Learning 课程笔记文章标签：机器学习 Andrew-Ng machine 神经网络

本文链接：https://blog.csdn.net/ironyoung/article/details/48412631

版权

本文是Andrew Ng的Coursera机器学习课程笔记，聚焦神经网络的Backpropagation部分。介绍了神经网络的成本函数、反向传播算法的原理及实践中的注意事项，包括权重初始化和层数、神经元数量的选择。还提到了梯度检查以验证算法正确性。

摘要由CSDN通过智能技术生成

此文是斯坦福大学，机器学习界 superstar — Andrew Ng 所开设的 Coursera 课程：Machine Learning 的课程笔记。力求简洁，仅代表本人观点，不足之处希望大家探讨。
课程网址：https://www.coursera.org/learn/machine-learning/home/welcome

Week 4：Neural Networks_1笔记：http://blog.csdn.net/ironyoung/article/details/48153375

对于BP（backpropagation），以前写过心得以及资料的总结，最终利用C++实现了简单的BP神经网络。具体见这里：《C++从零实现BP神经网络》

上一篇blog中，介绍了前向传播(forward propagation)的过程，以及神经网络计算非线性问题的例子(XOR问题)
这一篇blog中，开始介绍，如何来计算神经网络中各种参数的方法：后向传播(backward propagation)

Cost Function

为了拟合神经网络的各个参数，我们首先需要规定一些变量：
1. m个样本：{ $(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),...,(x^{(m)},y^{(m)})$ }
2. 神经网络层数（包括输入层、输出层）： $L$
3. 每层上的神经元个数（不包括每层上的偏差单元，也就是输入恒为1的单元）： $S_{l}$ ，如果是最后一层则记为： $S_{L}$
1. 不同分类问题：若分为2类，其实用一个神经元作为输出层就可以了，用 $y=0$ 和 $y=1$ 区分；多类问题，利用以前说过的，分为K类则最终的 $y\in\mathbb{R}^{K}$ ，例如分为三类的问题输出可选择为 $y=(1 0 0)^T,y=(0 1 0)^T,y=(0 0 1)^T$
2. 因为同样是分类问题，我们回想一下逻辑回归的cost function，其实神经网络的相同，只不过是对于分为K类问题的版本而已：
J(θ)=−1m[∑i=1m∑k=1K(y(i)klog(hθ(x(i)))k+(1−y(i)k)log(1−hθ(x(i)))k)]+λ2m∑l=1L−1∑i=1Sl∑j=1Sl+1(θ(l)