Search engines
- 将文档集给它,它会自动管理
时序数据库
- 物联网
- 每个时间间隔都会回报给一个数据。
- CPI 做 一个数据和两个小时的数据做同比环比的操作;比关系数据库好多
- 交易所
- 交易量随着时间的波动是什么
- 日志分析
图数据库
- 欺诈识别
- 就很多信息 和 个 关联在一起,就很方便就查出来 该人的信息
- 推荐系统
- 知识图谱
- RDF store
时空数据库
- LBS : Location Based Service
- 气象
- 地理、地质
多系统并存的问题
- 好处就是应用的效益会更大
- 但是代价如果认为太高了,就做到收敛
移动数据 vs 移动计算
- 如果数据在关系数据库中,要对数据做处理的话
- 移动数据:把数据从关系数据库中抽取出来,放在hadoop系统中,用mapreduce计算
- 移动计算:将代码写在关系数据库中的存储过程中,直接在关系数据库中进行处理。
- 在带宽的角度来讲,会选择移动计算。
- 在数据分布在不同的系统中时,不得不选择移动数据
- hadoop: 在hadoop上sql ,就是不想移动数据
数据移动
- ETL tools : 批量的把数据 从hadoop 移动到 DBs等
- Messageing systems:实时的
数据处理: (底层)
- Spark,flink (并行化)
- DBs
分析工具
- OLAP,R,Mahout,SAS
机器学习
- Tensorflow