接下来,我们在以“月份”分组的基础上,再添加“商品”维度的分组。
代码如下:
join_data.groupby(["payment_month","item_name"]).sum()[["price","quantity"]]
解释一下代码:
同样使用groupby()函数,多个数据列分组的情况下,可以使用List(列表)。
点击"运行",执行效果如下图所示。
实际业务中,也可以使用pivot_table函数来显示分析结果,它是以表格的形式进行展示。
代码如下:
pd.pivot_table(join_data,index="item_name",columns="payment_month",values=["price","quantity"],aggfunc="sum")
解释一下代码:
第1个参数:join_data。表示分析的数据集合。
第2个参数:index="item_name"。表示纵向的数据。
第3个参数:columns="payment_month"。表示横向的数据。
第4个参数:values=["price","quantity"]。表示具体的数据值。
第5个参数:aggfunc="sum"。表示数据的分析方式是sum,累计相加。
点击"运行",执行效果如下图所示。
观察分析结果,可以发现,价格普遍较高的是“PC-E”,价格普遍最低的是“PC-A”。从销量来看,商品“PC-E”,在2019年6月到2019年7月,销量有一个明显的增长。仔细观察上面的数据,还可以分析出很多信息内容。
最后呢,如果我们能把分析的结果,用图片的方式展示出来就更好了。
这就是数据的可视化,下一节继续学习。
此处为语雀文档,点击链接查看:https://www.yuque.com/codeclub/yvmeco/friz9v