特征缩放

特征缩放

如果有多个特征,为了让这多个特征都在一个相近的范围内,这样梯度下降法就能更快的收敛。

均值归一化

xμs x − μ s

其中 μ μ 为均值,s为特征值的范围,即max-min。

学习率 α α

梯度下降算法迭代过程中的代价函数J θ θ )的值,如果梯度下降算法正常工作,那么每迭代一部后代价函数下降,当到达多次迭代后,代价函数不继续下降了,梯度下降算法收敛。
如果代价函数随迭代次数程上升趋势,说明梯度下降算法没好好工作,我们应该用更小的 α α 值。

标准方程法

标准方程法是求解 θ θ 的另一种不迭代的方法,
这里写图片描述
矩阵表示求 θ θ :
θ=(XTX)1XTy θ = ( X T X ) − 1 X T y

何时使用梯度下降法,何时使用标准方程法

1、梯度下降法需要选择学习速率 α α ,需要多次迭代;
2、标准方程法不需要选择学习速率 α α ,不需要多次迭代,也不需要画出J( θ θ )的曲线来检查收敛性或者采取所有的额外步骤;
3、梯度下降法在很多特征变量的情况下也能运行很好;
4、标准方程法需要计算 (XTX)1 ( X T X ) − 1 ,但是 XTX X T X 是一个n*n的矩阵,实现逆矩阵的计算量大致是矩阵维度的三次方,当n很大时,计算量很大,标准方程法会很慢。
所以当n很大的时候使用梯度下降法,例如n上万。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值