红酒质量的相关性分析

一,数据准备

导入所用module:

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

导入数据

data = pd.DataFrame(pd.read_csv('winequality-red.csv',sep=';'))

预览数据

data.info()

在这里插入图片描述

data.describe()

在这里插入图片描述

data.head()

在这里插入图片描述
数据包括红酒的:fixed acidity:非挥发性酸
volatile acidity : 挥发性酸
citric acid:柠檬酸
residual sugar :剩余糖分
chlorides:氯化物
free sulfur dioxide :游离二氧化硫
total sulfur dioxide:总二氧化硫
density:密度
pH:pH
sulphates:硫酸盐
alcohol:酒精
quality:质量
通过预览数据我们知道红酒各个性质的数据类型,且无空值,意味着我们不必进行空值处理。得到了数据的简单的描述性统计,让我们对数据有了一个大体上的印象。
此次我们分析的目的是找出与红酒质量相关性最大的因素,即红酒的那些性质最有可能最终影响红酒的质量评估。
接下来我们先用图表观察数据,看看能不能得出些初级的结论及数据是否适合进一步分析

  • 9
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值