第一节 特征归一化
1. 方法
- min-max normalization:
- z-score normalization
2. 为什么要对数值类型的特征做归一化?
作用:加速收敛过程,快速通过梯度下降寻找最优解。
原理:举例预测房价的线性回归模型,有两个特征房间数(rooms)和面积(squares)。
Price = theta2 * Rooms + theta1 * Squares
Rooms的取值范围可能为【1,10】,squares的取值范围可能为【1,1000】,那么我们最后求出的函数可能为:
Price = 600 * Rooms + 60 * Squares
在学习速率相同的情况下,theta2需要更多的迭代次数(如果用梯度下降法)收敛。
但如果使用归一化,rooms和squa