在做分类时,常常需要估算不同样本之间的相似性度量,通常采用的方法就是计算样本间的距离,以下介绍三种计算距离的方法:欧式距离、曼哈顿距离、最大距离
注意:此处使用的数据集是鸢尾花数据集
#1.欧氏距离:又称为欧几里得距离,它是度量欧几里得空间中两点间的直线距离
#在R中,可使用dist()函数并指定计算的距离的方法,令参数method=euclidean计算欧氏距离
library(dplyr)
dist(newdata,method="euclidean",upper = T,diag = T)
#2.曼哈顿距离,又称为城市区块距离,用以表明两个点在欧几里得空间的固定直角坐标系上的绝对轴距的总和
dist(newdata,method="manhattan",upper=T,diag=T)
#3.最大距离,又称为契比雪夫距离,他为两个点之间的各个坐标分量差的最大值
dist(newdata,method="maximum",upper=T,diag=T)