Spark初学之Spark的四个特点

1.运行效率高:

为什么说运行效率高呢?

一是因为spark提供了一个全新的数据结构,这个是基于内存来做计算的,且当内存不足时还可以放入磁盘上去。整个流程是基于DAG(有向无环图)的执行引擎支持无环数据流;

二是因为整个spark是基于线程来运行的,线程的启动和销毁都由于进程;

2.易用性好:一是spark提供了多种操作语言的API:例如有Python、SQL、Scala、Java、R语言;

二是提供了非常多的高阶API,这些API在不同操作语言中都是类似的,大大降低了程序员的学习成本;

3.通用性强:spark提供了非常多的工具库,包括spark core、spark sql、spark streaming、MLib、GraphX,可以直接让我们在一个应用中使用多个工具库,其中,Spark SQL 提供了结构化的数据处理方式,Spark Streaming 主要针对流式处理任务(也是本书的重点),MLlib提供了很多有用的机器学习算法库,GraphX提供图形和图形并行化计算。

4.随处运行:一个是编写好的spark程序可以提交到多个资源平台上运行:local spark集群 yarn 支持其他的云平台;

二是spark框架可以和多种软件进行集成、方便我们对接不同的软件完成处理;

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值