大数据的概念:
指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有 更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据的特点(4v):
Volume(大量)
Velocity (高速)
Variety (多样性)
结构化数据:传统型数据库(mysql或者oracle)
半结构化数据:xml或者json
非结构化数据:音频 视频 图片
Value (低价值密度)
数据量很大,但是获取有价值的东西很少
大数据的单位:
1D = 1024N
1N = 1024B
1B = 1024Y
1Y = 1024Z (目前的数据量ZB)
1Z = 1024E
1E = 1024P
1P = 1024