Spark 2.4 正式发布，重要功能详细介绍

最新推荐文章于 2022-11-30 14:43:05 发布

yiyidsj

最新推荐文章于 2022-11-30 14:43:05 发布

阅读量462

点赞数

分类专栏：大数据人工智能互联网文章标签： spark 大数据大数据开发大数据学习大数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yiyidsj/article/details/104212646

版权

如下：♦ 添加一种支持屏障模式(barrier mode)的调度器，以便与基于MPI的程序更好地集成，例如，分布式深度学习框架;♦ 引入了许多内置的高阶函数，以便更容易处理复杂的数据类型(比如数组和 map);♦ 开始支持 Scala 2.12;♦ 允许我们对 notebooks 中的 DataFrame 进行热切求值(eager evaluation)，以便于调试和排...

摘要由CSDN通过智能技术生成

如下：

♦ 添加一种支持屏障模式(barrier mode)的调度器，以便与基于MPI的程序更好地集成，例如，分布式深度学习框架;

♦ 引入了许多内置的高阶函数，以便更容易处理复杂的数据类型(比如数组和 map);

♦ 开始支持 Scala 2.12;

♦ 允许我们对 notebooks 中的 DataFrame 进行热切求值(eager evaluation)，以便于调试和排除故障;

♦ 引入新的内置 Avro 数据源。

除了这些新功能外，该版本还重点关注可用性，稳定性和优化，解决了超过1000 个tickets。 Spark 贡献者的其他显着特征包括：

♦ 消除 2GB 块大小的限制 [SPARK-24296, SPARK-24307]

♦ 提升 Pandas UDF [SPARK-22274, SPARK-22239, SPARK-24624]

♦ 图片模式数据源(Image schema data source )[SPARK-22666]

♦ Spark SQL 加强[SPARK-23803, SPARK-4502, SPARK-24035, SPARK-24596, SPARK-19355]

♦ 内置文件源改进 [SPARK-23456, SPARK-24576, SPARK-25419, SPARK-23

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark 2.4 正式发布，重要功能详细介绍

如下：♦ 添加一种支持屏障模式(barrier mode)的调度器，以便与基于MPI的程序更好地集成，例如，分布式深度学习框架;♦ 引入了许多内置的高阶函数，以便更容易处理复杂的数据类型(比如数组和 map);♦ 开始支持 Scala 2.12;♦ 允许我们对 notebooks 中的 DataFrame 进行热切求值(eager evaluation)，以便于调试和排...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。