1.2 大数据的定义和主要特征
大数据不仅仅是数据的“规模性”,而是包含“高速性”、“多样性”和 “价值性”等多重属性。
规模性:
大数据摩尔定律:根据IDC作出的估测,人类社会产生的数据量一直都在以每年50%的速度增长,即每两年产生的数据量就会增加一倍。
小tip:1 PB = 1024 TB,1 EB = 1024 PB,1 ZB = 1024 EB(ZB > EB >PB)
多样性:
高速性:
1秒定律:1秒定律是互联网进入大数据时代对数据处理速度的要求,即秒级的时间内给出响应结果。这是大数据技术区别于传统数据技术的重要一点。
实时分析而非批量式分析
价值性:
价值密度低,商业价值高
挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息
1.3 大数据与云计算、人工智能和物联网
1.4 大数据发展现状和趋势
大数据的生命周期:
大数据主要技术:
Hadoop :
Apache Hadoop是一个用java语言实现的软件框架,为用户提供了系统底层细节透明的分布式基础架构,其核心是分布式文件系统HDFS和MapReduce(分布式处理)。
Hadoop生态:
大数据发展应用和前景:
略