为什么需要做特征值归一化:
对于特征是年龄、身高、年薪,标签是择偶观的样本数据而言,显然利用特征的差值来估算择偶观来看,年薪这一特征值对于计算结果的影响最大。因此,我们需要对样本数据做归一化处理。
对于每一行样本数据来说,归一化处理公式如下:
normDataSet=(data-min)/(max-min)
就上图对于(年龄、身高、年薪)=(20、178、20000)的这行数据来说,归一化之后,这行数据会更改为:
年龄=(20-20)/(30-20)=0
身高=(178-160)/(