这是我的第一篇技术博客,以后将陆续更新大数据部分及其它周边,因为我也是边学边更,写的不对的地方请大家指正,不胜感激,共同进步~
1. 大数据的定义
指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。
2. 大数据的5V特点(IBM提出)
Volume(大量)
Velocity(高速)
Variety(多样)
Value(低价值密度)
Veracity(真实性)
主要解决的是:海量数据的存储和海量数据的分析计算问题