数据分析的一般流程介绍
数据分析的真正价值在于发现问题,解决问题,创造价值。使用什么软件、工具并不是重要。现在市面上的出现的好多机构,解决的更多的是入门使用工具的问题,演变成手段问题。
数据分析是把现实的问题转化为数据能够解决的问题,使用我们学习到的知识和经验,将数据提炼出来的信息应用,创造价值的过程。
分为三部:
从问题到数据,数据到信息,信息到行动。
- 问题到数据:[5-15%]
- 准确定义实际问题
- 评估当前状况
- 确定数据挖掘的目标
- 制定项目计划
- 数据到信息
数据准备[10-15%]- 收集数据
- 描述数据
- 初步探索变量关系
数据处理[45-55%] - 数据处理
- 数据变换
- 变量选择
建模 [5-15%]
模型评估[5-10%]
- 模型应用[10-15%]
- 结果交流展示
- 行动计划
- 模型监测维护
- 项目评估反馈
从问题到数据
(准确定义实际问题,评估当前状况,确定数据挖掘目标,制定项目计划)
谁是你的客户? 你知道你的客户嘛,你要怎么与他们交流?
你能把问题具体化嘛?
理解你的客户的问题
问题1:如何提高产品销售量?
问题2:今年年初推出的新促销手段是不是提高了先锋先玉696玉米种子在西南地区的销售量?
-
这个问题够不够具体化?
-
类别:比较,描述,聚类,判别还是回归
回归问题 -
需要什么样的数据?
现有数据?数据质量?需要收集什么数据?自变量,因变量
问题3:
某服装公司:要通过精准营销提高效率?