数据集来源:http://archive.ics.uci.edu/ml/datasets/Wine+Quality
引用说明
P. Cortez, A. Cerdeira, F. Almeida, T. Matos and J. Reis.
Modeling wine preferences by data mining from physicochemical properties.
In Decision Support Systems, Elsevier, 47(4):547-553. ISSN: 0167-9236.
需要用到的python库:numpy pandas matplotlib seaborn seaborn就是在matplotlib基础上面的封装,方便直接传参数调用
数据集说明
包含红葡萄酒和白葡萄酒两个数据集
winequality-red.csv
winequality-white.csv
实例数: red wine -1599 white wine-4898
属性(特征)数:11+输出属性
输入变量(基于物理化学测试)
1 - fixed acidity 固定酸度
2 - volatile acidity 挥发性酸度
3 - citric acid 柠檬酸
4 - residual sugar 残糖
5 - chlorides 氯化物
6 - free sulfur dioxide 游离二氧化硫
7 - total sulfur dioxide 总二氧化硫
8 - density 密度
9 - pH PH值
10 - sulphates 硫酸盐
11 - alcohol 酒精</