简清凌 2220172205 大数据概论作业 聚类分析
- 输入数据并形成数据结构 A<-c(“Y”,“Y”,“N”,“N”,“Y”) B<-c(“N”,“Y”,“Y”,“Y”,“N”) C<-c(“Y”,“Y”,“Y”,“Y”,“N”) D<-c(“Y”,“Y”,“Y”,“Y”,“Y”) E<-c(“N”,“N”,“N”,“Y”,“N”) F<-c(“Y”,“N”,“Y”,“Y”,“Y”) workdata<-rbind(A,B,C,D,E,F)
- 将字符型化为数值型变量 workdata[which(workdata==“Y”)]=1 workdata[which(workdata==“N”)]=0
- 将数值转化为欧式距离(此题不需进行数值标准化)workdist<-dist(workdata,method=“euclidean”)
- 进行聚类分析 workclust<-hclust(workdist)
- 将数据分成3类 workclust<-hclust(workdist)
- 显示图像 plot(workclust)