项目第十四天——项目成果展示
我们组的项目是超市电商数据分析,本案例将对某大型超市的零售数据进行数据分析,通过了解运营状况,做出合理的决策。
首先是读取,清洗数据。使用pandas的read_csv读取数据后,查看各列数据的空值情况,发现Postal Code字段(邮编字段)有空值,而且这一列不重要,所以首先删除掉Postal Code列;使用DataFrame对象的describe()方法,没有发现异常数据,所以,不必处理;将Order Date订单日期字段的数据修改为datetime类型;为了后续分析方便,从订单日期中分别提取年、月、季度数据,并添加三个列用来存取年、月、季度信息,分别为:’Order-year’,’Order-month’,’quarter’。然后是数据分析,利润分析。先根据年和月进行分组,再分别提取各年份(2011-2014年)的数据,分析各年份对应月的利润情况。然后是客单价分析,以及每年销售额与销售额的增长率分析,分析各个地区分店的销售额,销量分析与销售淡旺季分析,分析新老客户数,用户数据分析,用户价值度RFM模型分析,客户群体与产品种类的关系分析,发货时间与发货成本分析。