eg:回头在复习复习spark的理论,此文档作为学习的记录
hadoop与spark做对比
hadoop->
1、mapreduce,延迟高
2、磁盘io开销太大,许多机器学习算法都是不断地迭代的,磁盘开销太大
3、
Flink和Beam
eg:回头在复习复习spark的理论,此文档作为学习的记录
hadoop与spark做对比
hadoop->
1、mapreduce,延迟高
2、磁盘io开销太大,许多机器学习算法都是不断地迭代的,磁盘开销太大
3、
Flink和Beam