项目背景
一份母婴产品(2012年/7月到2015年/2月)的销售数据,以便于了解目前市场的销售情况,便于做出运营决策,提高销售额。
数据集来自天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=45
数据集包括两个表:
分析目的: 分析以往的数据表现,寻找优化切入点,并针对性提出改善方案,已达到提升销量和营业额、减少经营成本的效果。
分析思路: 以销量这个结果指标,从用户id,商品类别,购买时间,婴儿年龄,性别维度继续拆分细化数据,提出假设,分析问题
分析目的: 分析以往的数据表现,寻找优化切入点,并针对性提出改善方案,已达到提升销量和营业额、减少经营成本的效果。
一、数据清洗
- 销量数据的异常值是整一个分析当中影响最大的,数据录入错误或运营的刷单等行为,会让个别时间段的销量猛增,严重影响趋势的判断,因此先剔除销量中的异常值。
- 整合数据:通过Power Query将商品交易表和婴儿信息表根据用户ID合并到一张表里,删除用不到的auction_id、property两列。(此处可以通过Vlookup函数连接两张表。)。
- 将各个字段数据类型更换成合适的类型。