【云原生之kubernetes实战】在k8s环境下部署Spark分布式计算平台
一、Spark介绍
1.Spark简介
Spark是分布式计算平台,是一个用scala语言编写的计算框架,基于内存的快速、通用、可扩展的大数据分析引擎。
2.Spark作用
Apache Spark 是一个快速的,通用的集群计算系统。它对 Java,Scala,Python 和 R 提供了的高层 API,并有一个经优化的支持通用执行图计算的引擎。它还支持一组丰富的高级工具,包括用于 SQL 和结构化数据处理的 Spark SQL,用于机器学习的 MLlib,用于图计算的 GraphX 和 Spark Streaming。
二、检查本地集群状态
1.检查工作节点状态
[root@master ~]# kubectl get nodes
NAME STATUS