对数据进行scale的原因是:
使用梯度下降法时,下降快,减少迭代次数
使用梯度下降法时,下降快,减少迭代次数
梯度下降法和解方程式法
梯度下降法:
1、需要确定控制下降速度的参数alpha
2、需要多次迭代
3、当特征维度很大时,照样work well
解方程式法
1、不需要确定控制下降速度的参数alpha
2、不需要迭代
3、要求解inv(x'x)
可能会不可逆,
1).特征有冗余时
2).m<=n,特征太多,m样本总数,n特征维度
解决方案,删掉一些特征或者进行特征正则化
4、当特征维度n特别大时,解方程速度变慢