1)大数据是什么
指数据集的大小超过了现有典型数据库软件和工具的处理能力的数据
2)大数据特点
①海量化(Volume):数据量从TB到PB
②多样化(Variety):数据类型复杂,超过80%的数据是非结构化的
③快速化(Velocity):数据量在持续增加(两位数的年增长率)
数据的处理速度要求高
④高价值(Value):在海量多样数据的快速分析下能够发挥出更高的数据价值
3)大数据能做什么(海量数据背景下)
①快速查询 全量查询
② 数据存储 量大 文件大
③ 快速计算 对边传统方式 【属于离线计算】
④ 实时计算 最新数据
⑤数据挖掘 新价值
4)大数据项目流程
①数据生产
②数据采集
③数据存储
④需求分析
⑤数据预处理
⑥数据计算
⑦结果数据存储
⑧结果数据展现