对于大数据的定义,本来就是一个大数据(joke)。特别是目前关于大数据的文章层出不穷的时期。
书中对大数据提出了4V定义:Volume,Variety,Veracity,Velocity。而真正的难题在于对数据的操作:数据的采集、存储、检索、共享、分析和数据可视化。
要理解大数据,要理解三个问题:
- 大数据是什么?
- 大数据为何如此重要?
- 如何利用大数据解决问题?
学习大数据,必须掌握5项基本技能:
- 数据挖掘;
- 数据可视化;
- 数据分析;
- 数据操作;
- 数据发现。
目前的发展是大数据的分布式处理,未来的发展将是大数据在大内存中如何快速处理!