葡萄酒数据分析

这篇博客探讨了葡萄酒数据,特别是红葡萄酒和白葡萄酒之间的品质差异。通过分析,我们发现缺陷在某些特定区站更为集中,其中某些设备缺陷频发。此外,还揭示了这些缺陷最严重的区站中,哪种设备最常出现问题,以及最常见的设备通常伴随的缺陷类型。
摘要由CSDN通过智能技术生成
  • 引入包,查看数据
import pandas as pd
import matplotlib.pyplot as plt
# 支持中文
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
read_df = pd.read_csv('winequality-red.csv',sep=';')
white_df = pd.read_csv('winequality-white.csv',sep=';')
white_df.head()
read_df.head()
  • 新增颜色列
import numpy as np
# 为红葡萄酒数据框创建颜色数组
color_red = np.repeat(0,read_df.shape[0])

# 为白葡萄酒数据框创建颜色数组
color_white = np.repeat(1,white_df.shape[0])

read_df['color'] = color_red
white_df['color'] = color_white
  • 合并红白葡萄酒数据集
wine_df = read_df.append(white_df)
wine_df.info()
wine_df.to_csv('winequality_edited.csv',index=False)
wine_df.to_csv('winequality_edited1.csv')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值