该wine数据集包含对意大利特定地区种植的葡萄酒的化学分析结果。178 个样品中代表了三种类型的葡萄酒,每个样品记录了 13 次化学分析的结果。
数据集是否存在缺失值
data(wine, package="rattle")
library(VIM )
aggr(wine, prop=FALSE, numbers=TRUE)
数据集不存在缺失值
数据集的变量中哪些变量存在相关?
library(ggcorrplot)
wine[,-1] %>%
cor() %>%
round(2) %>%
ggcorrplot(hc.order = TRUE,lab = TRUE)
Hue, Proanthocyanins , Dilution Phenols Flavanoids 这几个变量的相关性比较大
决策树分类模型可视化,会使用哪些特征
library(rpart)
dtree <- rpart(Type ~