大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合;是需要新处理模式才能具有更强的决策力,洞察发现力和流程优化能力的海量、高增长和多样化的信息资产。
大数据5V特征
Volume 数据体量大
采集数据量大
存储数据量大
计算数据量大
TB、PB级别起步
Variety 种类、来源多样化
种类:结构化、半结构化、非结构化
来源:日志文本、图片、音频、视频
Value 低价值密度
信息海量但是价值密度低
深度复杂的挖掘分析需要机器学习参与
Velocity 速度快
数据增长速度快
获取数据速度快
数据处理速度快
Veracity 数据的质量
数据的准确性
数据的可信赖度