大数据这个词近些年非常火,其实在很多年前大家就开始利用大数据的一些方法和过程了。
耳熟能详的“决策支持系统”,“应急预案系统”,“舆情监测系统”等等,早在2005年前后就如雨后春笋般冒出来了。
最近听了Coursera的一个关于Data Analystics的课程,其中将大数据分析的过程分成四个步骤。
在这里相信有许多想要学习大数据的同学,大家可以+下大数据学习裙:957205962,即可免费领取套系统的大数据学习教程
而翻阅了一些相关的书籍和资料发现不论是《大数据分析》的6步过程模型,还是其他文章提到的5个阶段,归纳起来都是这四个步骤。
1
发现
从应用目标出发,确定所需的数据。
这里面包括定义问题,找出干系人的期望和顾虑;提出假设“可能会发生什么事情?”;收集数据并进行一些处理和分析。
问题的定义非常重要。
我们