Spark2.4.0发布了!

Spark2.4.0 今天官网发布,这是一个大好消息。

Spark 2.4.02.x的第五个发型版本。官方发布消息链接如下:

http://spark.apache.org/releases/spark-release-2-4-0.html

此版本继续关注可用性,稳定性和优化,浪尖在这里摘要翻译一下,主要的关注点:

SparkCore SQL

  • 增加了Barrier ExecutionMode,可以更好的和深度学习的框架整合

  • 同时引入了 30+ 内置函数和 higher-order函数可以处理更复杂的数据类型

  • 改善了与k8s的整合

640

  • 支持scala 2.12

  • 内置支持了Avro格式数据源,这个感情好,后面浪尖给出测试案例,以后有pb的支持那就更好了。

性能和稳定性

这个优化比较多,值得关注

  • Connector优化

这个优化主要是Parquetorccsvavro等的优化升级

640

MLlib

  • MLlib支持了图像格式的数据源

StructuredStreaming

  • 使用foreachBatch(支持PythonScalaJava)将每个微批的输出行暴露为DataFrame

  • Python API 增加了foreach 和 ForeachWriter

  • 支持使用“kafka.isolation.level”读取使用事务的生产者生产到kafka topic的已提交消息。 

Spark SQL的升级页面里也有对Spark 2.4 SQL 方面的调整优化,大家有兴趣也可以看看,有没有自己关注的bug被修复了。

http://spark.apache.org/docs/latest/sql-migration-guide-upgrade.html#upgrading-from-spark-sql-23-to-24

细心的同学注意到了,Spark Streaming已经稳定到不用更新了,,,还是说Spark Streaming已经凉凉了。

推荐阅读:

spark源码导读一

解惑:这个SPARK任务是数据倾斜了吗?

640

欢迎转发,点赞

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值