问题提出
当数据没有标签或者有少量标签的时候,我们需要使用聚类分析来发现数据的模式。便于理解聚类分析的结果或者效果,如何对聚类分析做可视化呢?
解决方法
第一步:安装和加载聚类分析R包-factoextra
library(pacman)
p_load(factoextra)
第二步:导入数据集,采用R语言自带的
USArrests
# 导入数据集
data("USArrests")
# 数据集理解
?USArrests
# 数据集检视
head(USArrests)
第三步:数据集准备与处理,对数据集做标准化处理,每列转换为均值为0,标准差为1
df head(df, 10)
第四步:聚类分析及可视化。
不管是层次聚类还是划分聚类,都要寻找一个距离度量。然后根据计算后的距离,采用不同的策略进行数据集的汇聚。
4.1