第十一届泰迪杯数据挖掘大赛问题一(上)

文章探讨了如何通过读取CSV文件分析产品价格对需求量的影响,并使用数据可视化展示平均需求量与价格的关系。接着,文章讨论了产品所在区域对需求量的影响,通过并列柱状图展示了不同区域和产品大类编码下的需求量特性。
摘要由CSDN通过智能技术生成

产品在不同价格对需求量的影响

读取csv文件,提取出产品需求量与价格

df=pd.read_csv("order_train0.csv")
dfgroup=df.groupby("item_price")["ord_qty"].mean().reset_index()

df.reset_index()函数是使用索引生成一个新的dataframe或series

缺少reset_index()函数将会出现如下情况

 即在字典中找不到对应的键值

可视化产品的平均需求量与价格之间的关系

plt.rcParams['font.sans-serif'] = ['SimHei']  # 设置图像字体为黑体,同时可以显示中文
plt.rcParams['axes.unicode_minus'] = False  # 设置显示负号

#可视化
plt.figure(figsize=(10,6))
x=MultipleLocator(4000)
ax=plt.gca()
ax.xaxis.set_major_locator(x)
plt.plot(dfgroup["item_price"],dfgroup["ord_qty"],'o-')
plt.xticks(fontsize=8)
plt.yticks(fontsize=8)
plt.xlabel("产品价格")
plt.ylabel("平均需求量")
plt.title("产品的不同价格对需求量的影响")
plt.show()

  产品所在区域对需求量的影响,以及不同区域的产品需求量有何特性

按照产品大类编码对产品进行细化

df=pd.read_csv("order_train0.csv")
df=df[['sales_region_code','first_cate_code','ord_qty']]

使用并列柱状图分析不同区域之间产品需求量的特性

dfgroup=df.groupby([df['sales_region_code'],df['first_cate_code']]).agg('sum').unstack().round(2)
plt.rcParams['font.sans-serif'] = ['SimHei']  # 设置图像字体为黑体,同时可以显示中文
plt.rcParams['axes.unicode_minus'] = False  # 设置显示负号
dfgroup.plot(kind='bar')
plt.xlabel('区域')
plt.ylabel('需求量')
plt.title('不同区域产品(按产品大类编码)需求量的特性')
plt.show()

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值