哪个化学成分影响葡萄酒的质量?
单变量情节部分
从数据可得,该数据集有4898 条数据和13个变量。
查看 quality 的分布
从图中可得,质量分数的分布范围是3至9,大部分的质量分数居中,最多为6分。
fixed.acidity的分布区间大多数在6到8之间,其峰值在6.5附近,基本属于正态分布。 volatile.acidity的分布区间大多数在0.15到0.4之间,其峰值在0.25附近,基本属于正态分布。 citric.acid的分布区间大多数在0.1到0.6之间,其峰值在0.3附近,呈现正态分布,分布在0.5附近出现异常变化。 这3种酸的分布类似quality的分布,我猜想是不是这3种酸对白葡萄酒的质量有重要影响?
residual.sugar的分布区间大多数在0.5到2之间,呈正偏斜分布。
chlorides的分布区间大多数在0到0.1之间,除去长尾后,基本呈正态分布。