![v2-d66f10c201d9c1b3bfee7f7bdcfe3b34_1440w.jpg?source=172ae18b](http://img-01.proxy.5ce.com/view/image?&type=2&guid=02c2ded7-692f-eb11-8da9-e4434bdf6706&url=https://pic1.zhimg.com/v2-d66f10c201d9c1b3bfee7f7bdcfe3b34_1440w.jpg?source=172ae18b)
今后给大家讲R,都不会单独的讲数据结构,因为感觉学起来太枯燥,讲起来也乏味。所以没讲到一个数据结构的时候,我会讲一个应用案例。
今天讲聚类算法及如何使用DataFrame,总共二十几行代码,很容易Get Skills.
###选用iris数据集
![v2-51dc1dbf9c07fdd187be4a060f237b31_b.jpg](http://img-03.proxy.5ce.com/view/image?&type=2&guid=02c2ded7-692f-eb11-8da9-e4434bdf6706&url=https://pic2.zhimg.com/v2-51dc1dbf9c07fdd187be4a060f237b31_b.jpg)
![v2-9cbf093874b6c7afcd8aa271122b61dc_b.jpg](http://img-03.proxy.5ce.com/view/image?&type=2&guid=02c2ded7-692f-eb11-8da9-e4434bdf6706&url=https://pic1.zhimg.com/v2-9cbf093874b6c7afcd8aa271122b61dc_b.jpg)
#对比实际类别和预测类别的差异,查看分错的样本
#install.packages("dplyr")
iris%>%group_by(Species)%>%summarise(mean(Sepal.Length))
center_order<-data.frame(iris%>%group_by(Species)%>%summarise(center=mean(Sepal.Length)),stringsAsFactors = FALSE)
center_order[,'cluster']<-order(ks$centers[,'Sepal.Length'])
#[1] 1 3 2
data_plot=left_join(iris,center_order,by=c("Species_predict"="cluster"))[,c('Sepal.Length','Sepal.Width','Petal.Length','Petal.Width','Species.x','Species.y')]
data_plot=data.frame(iris%>%inner_join(center_order,by=c("Species_predict"="cluster")),stringsAsFactors = FALSE)
data_plot$result=ifelse(data_plot$Species.x==data_plot$Species.y,data_plot$Species.x,'BadCase')
echartr(data_plot, x=Sepal.Width, y=Petal.Width, series=result)
table(data_plot$result)
# 1 2 3 BadCase
# 50 48 36 16
#上述BadCase表示分错,所以有16个分错的,即分对的概率达到90%左右
![v2-c4e79920e7462fbf3b6fa3771cbe5d79_b.jpg](http://img-03.proxy.5ce.com/view/image?&type=2&guid=02c2ded7-692f-eb11-8da9-e4434bdf6706&url=https://pic2.zhimg.com/v2-c4e79920e7462fbf3b6fa3771cbe5d79_b.jpg)
有任何疑问可以 @QQ ZHOU ,历史R相关文章
相关学习资源:
QQ ZHOU:从零开始入门R语言-软件下载及安装
QQ ZHOU:从零开始入门R语言—Rstudio下载与安装
QQ ZHOU:Linux下安装R包报错处理
QQ ZHOU:从0开始入门R语言—DataFrame及聚类算法
QQ ZHOU:一文读懂:Logistic回归解决分类问题原理 [内附视频讲解]
QQ ZHOU:从0开始入门R语言—主成分分析PCA
QQ ZHOU:从0开始入门R语言—决策树之C5.0
QQ ZHOU:R语言实现推荐算法—基于用户协同过滤
QQ ZHOU:解决R效率问题—parallel多线程启动