数据分析流程:
确定分析目标——获取数据——清洗数据——构建模型并分析——结论
1.确定分析目标:
找出淘宝一段时间内的用户流失原因
2.获取数据:
数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1
数据下载完成后导入MySQL,部分数据显示如下:
数据观察:
1)用户ID,字符串类型
2)商品ID,字符串类型
3)商品类目ID,字符串类型
4)行为类型:字符串,枚举类型
5)时间戳:整型
3.清洗数据:
1)处理缺失值:
</