大数据【介绍】
1)大数据是什么
2)大数据特点
3)大数据能做什么(海量数据背景下)
4)大数据项目流程
1)大数据是什么
指数据集的大小超过了现有典型数据库软件和工具的处理能力的数据
2)大数据特点
①海量化(Volume):数据量从TB到PB
②多样化(Variety):数据类型复杂,超过80%的数据是非结构化的
③快速化(Velocity):数据量在持续增加(两位数的年增长率)
数据的处理速度要求高
④高价值(Value):在海量多样数据的快速分析下能够发挥出更高的数据价值
3)大数据能做什么(海量数据背景下)
①快速查询 全量查询
② 数据存储 量大 文件大
③ 快速计算 对边传统方式 【属于离线计算】
④ 实时计算 最新数据
⑤数据挖掘 新价值
4)大数据项目流程
①数据生产
②数据采集
③数据存储
④需求分析
⑤数据预处理
⑥数据计算
⑦结果数据存储
⑧结果数据展现

大数据是指数据量巨大、类型复杂、增长迅速的数据集合,其特征包括海量化、多样化、快速化和高价值。在海量数据背景下,大数据能够实现快速查询、存储大量文件、高效计算以及实时数据挖掘,从而创造新的价值。大数据项目通常涉及数据生产、采集、存储、需求分析、预处理、计算、结果存储和展现等步骤。

被折叠的 条评论
为什么被折叠?



