数据分析项目流程
- 明确问题:明确数据分析的真实需求
- 理解数据:数据获取和探索
- 数据清洗:一个数据分析项目大部分时间都花费在了数据清洗上
- 数据分析和可视化:对清洗后的数据进行分析和可视化展示
- 结论和建议:对结果进行解读,得出有价值的结论并提出相关建议。
数据分析方法
- 常用统计方法:计算常用统计量和构建相关指标
- 图表法:通过各种图形结合来展示数据里面的信息
- 机器学习算法:对于复杂的分析,会涉及到模型的构建
零售消费数据
- 订单编号
- 产品编号
- 产品描述
- 产品数量
- 订单日期和时间
- 单位产品价格
- 客户编号
- 国家名称
分析的目的
- 购买商品数据前十的省份
- 最有价值的月份
- 用户消费行为分析
数据清洗
- 空数据的删除或者填充。
- 字符串格式的数据转成时间日期形式。
- 根据已有数据得到未知数据