Neural Networks and Deep Learning 学习笔记(三)

最新推荐文章于 2020-12-17 16:25:33 发布

土逗甜菜

最新推荐文章于 2020-12-17 16:25:33 发布

阅读量540

点赞数 2

分类专栏： TensorFlow 文章标签：深度学习神经网络算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lmw21848/article/details/51694216

版权

TensorFlow 专栏收录该内容

13 篇文章 2 订阅

订阅专栏

1. 怎么理解 $C(w,b) \equiv \frac{1}{2n} \sum_x \| y(x) - a\|^2$

首先， $\|v\|$ 是指范数

范函是一个函数，其为矢量空间内的所有矢量赋予非零的正长度或大小

好吧，这其实是个均方误差函数，可自行查阅百度百科，但是不明白为什么是 $\frac{1}{2n}$ 。

2. 什么是梯度下降，为什么要用梯度下降算法。

首先，梯度就是标量场某一点增长最快的方向向量，向量大小是这个最大变化率。

就比如一元函数（就是y=f(x)这种）函数，那么梯度的大小为其导数，因为导数就是 $\delta y / \delta x$ ，就是函数在这一点的变化率。而方向为切线方向，因为在x方向的变化量只有 $\delta x$ ，y方向的变化量只有 $\delta y$ ，而切线方向则为二者平方和的根号，显然切线方向增长最快。

我们知道沿梯度方向是增长最快的方向，那么沿着梯度的反方向就是减小最快的方向了。此时的减小率为最大也就是斜率。而 $x-最大减小率乘以步长$ ，可以保证x在越接近极值点时x减小程度越小。

所以神经网络中用梯度下降法逼近真实值非常好，不至于一次减小的过大造成更大偏差。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Neural Networks and Deep Learning 学习笔记(三)

1. 怎么理解C(w,b)≡12n∑x∥y(x)−a∥2 C(w,b) \equiv \frac{1}{2n} \sum_x \| y(x) - a\|^2首先，∥v∥\|v\|是指范数范函是一个函数，其为矢量空间内的所有矢量赋予非零的正长度或大小好吧，这其实是个均方误差函数，可自行查阅百度百科，但是不明白为什么是12n\frac{1}{2n}。2. 什么是梯度下降，为什么要用梯度下降算法。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。