1 背景
KNN算法采用测量不同特征值之间的距离方法进来分类,思想类似成语近朱者赤近墨者黑。
1.1 KNN流程
最常用的度量距离方法是欧式距离,即计算测试集与待预测数据差值的平方和开方(1)。若多维度数据数值范围差异较大,需要先对所有数据进行标准化(2)或归一化(3)处理.
------(1)
------(2)
KNN算法采用测量不同特征值之间的距离方法进来分类,思想类似成语近朱者赤近墨者黑。
最常用的度量距离方法是欧式距离,即计算测试集与待预测数据差值的平方和开方(1)。若多维度数据数值范围差异较大,需要先对所有数据进行标准化(2)或归一化(3)处理.
------(1)
------(2)