问题:1.为什么进行特征缩放
2.什么情况下进行特征缩放
3.怎样进行特征缩放
4.关于梯度下降的实用技巧学习速率α
5.如何选择合适的特征
6.怎么应用多项式的好处
回答:1.在多个特征的情况下运行梯度下降,可能需要很长时间才能收敛到全局最优,通过特征缩放改变取值范围使之都在相似的范围内,这样梯度下降的算法会收敛的更快。
2.比如X1是-1到+1那么X2是-0.0001到+0.0001那么X2就要进行放大,若X3是-100到+100的话那么X3就要缩小,总之原则是使之在较为相似的范围,可以不精确。
3.那么均值归一化就是一种不错的方法(x1-μ1)/S1这里μ1是x1的均值S1可以是x1的标准差也可以是x1的取值范围即最大值减去最小值
4.绘制横轴是迭代次数纵轴是代价函数的曲线,若曲线出现随着迭代次数增加而上升的话或者震荡上升下降则减小学习速率α,也可以使用算法来判断梯度下降算法是否收敛比如小于0.0001
5.有时够比如给出长和宽,但是用他们的乘积面积更为合适
6.多项式回归使得我们可以使用线性回归的方法来拟合函数,好吧这里我觉得讲的比较模糊现在看来不是十分明白有点晕