初来乍到,小兵一枚;
中关村老师介绍到:
(题外话:大数据分析就是可以预测未来事物的方法,简称算卦,而且相当准哦!)
大数据的定义:超出常规手段获取的大量数据集
特征:
Voluem:数据量大,包括采集,存储和计算的量都特别大;
Variety: 种类和来源多样化;
Velocity: 数据增长速度快,处理速度也快;
Veracity:数据的准确性,垃圾邮件代表的网络垃圾困扰着大数据发展;
Value:数据价值密度相对较低,却又弥足珍贵;
Variety--种类和来源多样化其中包括以下几种:
结构化数据——关系型数据表
半结构数据——邮件,HTML,报表,XML文档,Json
非结构化数据——WEB日志,实时多媒体,社交网络数据,文档类型数据
/1PB = 1024TB = 1,048,576 GB/
/1EB = 1024PB = 1,073,741,824GB/
/1ZB = 1024EB = 1,099,511,627,776GB/
人类文明开始到2003年地球共产生了5EB数据;
2012年全年,全球产生数据2.7ZBZ是2003年以前的500倍;
2015年,全球估计产生数据8ZB,等于1800万个美国国会图书馆;
好啦,小兵明天再来!