葡萄酒分类

本文通过对葡萄酒的深入探索性分析,揭示其不同类别间的特征差异,并为进一步的建模工作奠定基础。
摘要由CSDN通过智能技术生成
#加载数据
df = pd.read_csv("winequality-red.csv")
df.head()
#空值
df.isnull().any()
df.describe()# 简单的数据统计
# 总酸度,把固定酸,挥发酸,柠檬酸三项合起来定义一个新的特征总酸量。
df['total acid'] = df['fixed acidity'] + df['volatile acidity'] + df['citric acid']

探索性分析

#固定酸占总酸比重
plt.figure(figsize = (8,5))
plt.suptitle('固定酸占总酸比分布情况', y=1.02, fontsize = 16) #总标题
temp = df[{
   'total acid','fixed acidity'}]
temp['precent'] = temp.apply(lambda x: x['fixed acidity']/x['total acid'], axis=1) #计算占比
temp['precent'].hist(bins = 100)
plt.xlabel('红葡萄酒固定酸占比',fontsize = 12)
plt.ylabel('频数',fontsize = 12)

在这里插入图片描述

#固定酸占比对评分影响
plt.figure(figsize = (8,4))
plt.suptitle('固定酸占总酸比对评分的影响', y=1.02, fontsize = 
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值