机器学习(一)- feature scaling

特征缩放是机器学习预处理步骤,通过将特征值缩放到相似范围,有助于梯度下降更快收敛。文章解释了特征缩放的原理,以圆形contour map为例,说明缩放后能有效减少迭代次数,提高训练效率。均值归一化是常用的缩放方法,通过减去均值并除以范围或标准差实现。
摘要由CSDN通过智能技术生成

feature scaling

feature scaling(特征缩放) 的思想就是将所选特征的value都缩放到一个大致相似的范围。这样做的目的是为了加快收敛,减少采用梯度下降算法迭代的次数。那么为什么feature scaling能做到这点呢。
下面我们将利用stanford的Andrew Ng教授的PPT来说明。
这里写图片描述
首先,“将所选特征的value都缩放到一个大致相似的范围”这句话在代价函数 $J(\theta) $ 的contour map的呈现就是contour大致是个圆形(当然这是针对我们只有两个feature的时候,多feature可以推广)。
接下来我们要证明contour map越圆,收敛就越快。如果这一点说明了,那么feature scaling也就能达到加快收敛的目的。
上图中左边的例子,feature x 1 x_1 x1 的范围0-2000,feature x 2 x_2 x2 的范围1-5,范围相差很大,导致contour map呈现出一个比较夸张的椭圆形,我们知道我们是要运用梯度下降去求解

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值