数据来源:UCI数据库
数据连接:http://archive.ics.uci.edu/ml/datasets/Wine+Quality
UCI数据库中共12个变量,其中quality为结果变量,其他变量为特征变量,白酒品质分为10个等级(1-10),本数据集中有3至9共7个等级,为方便分析我们将白酒品质分为三个等级,品质为3、4、5的为“bad”,品质6为“mid”,品质7、8、9为“good”。
变量说明:
install.packages("e1071") #下载安装e1071软件包
install.packages("readxl") #下载安装readxl软件包
library(e1071) #加载e1071软件包
library(readxl) #加载readxl软件包
获取数据集