参考书: R语言实战_第2版_中文版 第四部分 高级方法 : 第16章 聚类分析 : 16.3 层次聚类分析
从 http://www.gdfc.org.cn/datas/history/twocolorball/history_1.html 抓取双色球开奖数据, 得到文件 cp7.txt
qishu,r1,r2,r3,r4,r5,r6,blue
2017001,09,11,14,20,25,26,15
2017002,15,19,23,24,25,32,03
2017003,01,04,08,15,27,32,16
... ...
2017093,07,08,09,15,22,27,12
2017094,08,11,13,19,28,31,06
2017095,09,10,12,19,22,29,16
cp7.R
cp7 <- read.csv("D:/test/cp7.txt", quote="")
View(cp7)
d <- dist(cp7)
as.matrix(d)[1:7,1:7]
fit.average <- hclust(d, method="average")
plot(fit.average, hang=-1, cex=.8, main="Average Linkage Clustering")
可见欧几里得距离最近的几期开奖期数: 96,87,85,90
2017096,02,06,11,12,19,29,06
2017087,03,06,13,14,19,28,06
2017085,01,05,06,16,25,30,09
2017090,01,07,10,16,22,33,09
是不是很相似啊