一.距离度量
1.欧氏距离
直观的距离度量方法, 两个点在空间中的距离一般都是指欧氏距离
2.曼哈顿距离
也称为“城市街区距离”(City Block distance),曼哈顿城市特点:横平竖直
3.切比雪夫距离
国际象棋中,国王可以直行、横行、斜行,所以国王走一步可以移动到相邻8个方格中的任意一个。 国王从格子(x1,y1)走到格子(x2,y2)最少需要多少步?这个距离就叫切比雪夫距离。
4.闵可夫斯基距离 MinkowskiDistance 闵氏距离
不是一种新的距离的度量方式。
是对多个距离度量公式的概括性的表述
二.特征预处理
归一化:
归一化:通过对原始数据进行变换把数据映射到【mi,mx】(默认为[0,1])之间
数据归一化:
通过对原始数据进行变换把数据映射到【mi,mx】(默认为[0,1])之 间
数据归一化API:
数据标准化:
通过对原始数据进行标准化,转换为均值为0标准差为1的标准正态分布的数据