官方定义:spark是一个基于内存的分布式计算框架
它会使得计算速度以及开发速度快!
特点:
One stack rule them all !
一站解决所有问题
热查询(Hive)
批处理(MapReduce)
实时流计算(Storm)
回顾MapReduce 的 Shuffle过程 见图
官方定义:spark是一个基于内存的分布式计算框架
它会使得计算速度以及开发速度快!
特点:
One stack rule them all !
一站解决所有问题
热查询(Hive)
批处理(MapReduce)
实时流计算(Storm)
回顾MapReduce 的 Shuffle过程 见图