产品在不同价格对需求量的影响
读取csv文件,提取出产品需求量与价格
df=pd.read_csv("order_train0.csv")
dfgroup=df.groupby("item_price")["ord_qty"].mean().reset_index()
df.reset_index()函数是使用索引生成一个新的dataframe或series
缺少reset_index()函数将会出现如下情况
即在字典中找不到对应的键值
可视化产品的平均需求量与价格之间的关系
plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置图像字体为黑体,同时可以显示中文
plt.rcParams['axes.unicode_minus'] = False # 设置显示负号
#可视化
plt.figure(figsize=(10,6))
x=MultipleLocator(4000)
ax=plt.gca()
ax.xaxis.set_major_locator(x)
plt.plot(dfgroup["item_price"],dfgroup["ord_qty"],'o-')
plt.xticks(fontsize=8)
plt.yticks(fontsize=8)
plt.xlabel("产品价格")
plt.ylabel("平均需求量")
plt.title("产品的不同价格对需求量的影响")
plt.show()
产品所在区域对需求量的影响,以及不同区域的产品需求量有何特性
按照产品大类编码对产品进行细化
df=pd.read_csv("order_train0.csv")
df=df[['sales_region_code','first_cate_code','ord_qty']]
使用并列柱状图分析不同区域之间产品需求量的特性
dfgroup=df.groupby([df['sales_region_code'],df['first_cate_code']]).agg('sum').unstack().round(2)
plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置图像字体为黑体,同时可以显示中文
plt.rcParams['axes.unicode_minus'] = False # 设置显示负号
dfgroup.plot(kind='bar')
plt.xlabel('区域')
plt.ylabel('需求量')
plt.title('不同区域产品(按产品大类编码)需求量的特性')
plt.show()