Apache Spark 3.0 拥抱大数据处理分析引擎

最新推荐文章于 2024-09-14 16:36:14 发布

boonya

最新推荐文章于 2024-09-14 16:36:14 发布

阅读量294

收藏

点赞数 1

分类专栏： # Apache Spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/boonya/article/details/108425686

版权

Apache Spark 专栏收录该内容

13 篇文章 3 订阅

订阅专栏

目录

资源概述

速度

使用方便

概论

无处不在

资源概述

github代码库：https://github.com/apache/spark

Python，Scala，Java一睹为快示例：http://spark.apache.org/examples.html

Spark Java版本示例：https://github.com/apache/spark/tree/master/examples/src/main/java/org/apache/spark/examples

作为Java编程开发者，官网已经尽可能为我们提供便利了，你想要的都在这里：

俗话说，知子莫如父，Apache spark的特性和版本指导都可以准确找到：http://spark.apache.org/documentation.html

Spark能干什么，请大家务必记住以下这些特性：

速度

运行工作负载的速度提高了100倍。

Apache Spark使用最新的DAG调度程序，查询优化器和物理执行引擎，可实现批处理和流数据的高性能。

Hadoop和Spark中的逻辑回归

使用方便

使用Java，Scala，Python，R和SQL快速编写应用程序。

Spark提供了80多个高级操作员，可轻松构建并行应用程序。您可以从Scala，Python，R和SQL Shell 交互使用它。

df =火花。阅读。json （“ logs.json” ） df。其中（“年龄> 21” ）。选择（“ name.first” ）。显示（）

Spark的Python DataFrame API
通过自动模式推断读取JSON文件

概论

结合使用SQL，流和复杂的分析。

星火权力库，包括一叠 SQL和DataFrames，MLlib机器学习， GraphX和星火流。您可以在同一应用程序中无缝组合这些库。

无处不在

Spark可在Hadoop，Apache Mesos，Kubernetes，独立或云中运行。它可以访问各种数据源。

您可以在EC2，Hadoop YARN，Mesos或Kubernetes上使用其独立集群模式运行Spark 。访问HDFS， Alluxio， Apache Cassandra， Apache HBase， Apache Hive以及数百种其他数据源中的数据。

切记：官网从来都是最好的老师，道听途说不足为信！

boonya

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

boonya

CSDN认证博客专家 CSDN认证企业博客

码龄14年

企业员工

840: 原创

3458: 周排名

142: 总排名

658万+: 访问

: 等级

6万+: 积分

1万+: 粉丝

1436: 获赞

651: 评论

5932: 收藏

私信

关注

热门文章

分类专栏

最新评论

Kubernetes(k8s) 架构设计
boonya: 在Kubernetes中，存储插件和云存储插件的作用是为Pod提供持久化存储功能，以解决容器间数据共享和数据持久化的问题。存储插件通常是针对本地存储系统设计的，而云存储插件则是专门针对各大云服务商提供的存储服务的。存储插件通常用于需要高性能、低延迟和本地数据存储的场景，例如数据库、日志系统等。而云存储插件适用于需要跨多个可用区或地域进行数据备份和灾备的场景。选择存储插件还是云存储插件取决于你的需求和环境。如果你已经在云服务商上部署了存储服务，可以考虑使用云存储插件；如果你有自己的数据中心或私有设备，可能会更适合使用存储插件。要部署存储插件或云存储插件，通常需要在Kubernetes集群上进行相应的配置和安装。你可以根据官方文档或社区指南来选择适合你的存储插件或云存储插件，并按照说明进行部署和配置。最好在测试环境中进行部署和调试，确保存储插件或云存储插件能够正常工作并满足你的需求。
Apache Hadoop3.2.2与Spark3.0.0环境安装
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
Kubernates(k8s)工作负载之工作负载资源
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
Kubernates(k8s)工作负载之Pods
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
Kubernetes(k8s) 架构设计
CSDN-Ada助手: kubernetes 中的存储插件和云存储插件分别用于什么场景，如何进行选择和部署？

大家在看

最新文章

2024年27篇

2023年31篇

2022年46篇

2021年87篇

2020年110篇

2019年167篇

2018年319篇

2017年248篇

2016年197篇

2015年115篇

2014年72篇

2013年88篇

2012年19篇

2011年9篇

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值