Spark--chap01简介与运行原理

概念

Spark是一个大规模数据处理的统一分析引擎

特点

迅速(可以理解为二代hadoop)

通用(业务场景上)

易用

支持多种资源管理器

Spark与Hadoop的区别与联系

解决问题的方式不一样

Hadoop是分布式数据设施,由普通计算机组成

Spark则是一个专门的工具,但它并不会进行分布式数据的存储

两者可合可分等

Hadoop可用自身的MapReduce来代替Spark

Spark也可不依赖Hadoop,而选择其他基于云的数据系统平台

Spark相对于HadoopMapRedue的优势

中间结果输出

数据格式和内存布局

误区

Spark是基于内存的技术

Spark要比Hadoop快 10x-100x

Spark的存在将代替Hadoop

…...

用途

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值