Spark是什么?

Spark特点:
     1、内存计算
     2、提供了支持DAG图的分布式并行计算框架,减少多次计算之间结果IO开销
     3、提供Cache机制来支持多次迭代计算或者数据共享,减少IO开销
     4、RDD之间维护了血统关系,一旦RDD fail掉了,能通过父RDD自动重建,保证了容错性
     5、移动计算而非移动数据,RDD Partition可以就近读取分布式文件系统中的数据块到各个节点内存中进行计算
     6、使用多线程池模型来减少task启动开销
     7、shuffle过程中避免不必要的sort操作
     8、采用容错的、高可伸缩性的akka作为通讯框架

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值