1 大数据带来的思维变化
- 不是样本,是整体:雾霾
- 不是原因,是关联:手电和蛋挞
- 不是精确,是混杂:谷歌翻译
2 大数据特征
- 大量
- 多样
- 速度快:推荐
- 真实性
- 价值密度低
3 科学研究第四范式
4 大数据生命周期
- 收集→储存→分析→管理
- 分析视角
数据源→收集→存储→处理→可视化→报告监控
- 技术视角
- 大数据的应用
上图来源【OLTP、OLAP、HTAP之间的区别 - CSDN App】
5 大数据体系结构
5.1 集中vs分布
集中:
- 高性能
- 高可靠性
- 高价
分布:
- 分布式存储
- 分布式处理
- 高冗余性
- 低价
5.2 大数据系统的三个基本层次
- 数据存储系统
- 数据处理系统
- 数据应用系统