工作日志——基于k8s构建可访问cassandra的spark集群

最新推荐文章于 2023-07-26 09:25:12 发布

小天屎

最新推荐文章于 2023-07-26 09:25:12 发布

阅读量2.1k

点赞数

分类专栏： kubernetes 工作日志文章标签： spark cassandra kubernetes

本文链接：https://blog.csdn.net/xts_huangxin/article/details/51280491

版权

工作日志同时被 2 个专栏收录

19 篇文章 0 订阅

订阅专栏

kubernetes

16 篇文章 0 订阅

订阅专栏

继续本周的工作，上一篇介绍了搭建简易spark集群的方法，这篇介绍一下搭建可访问cassandra的spark集群。

前提条件

已搭建好kubernetes集群，且开启kube-dns

集群搭建

启动spark-master

kubectl create -f yaml/spark-master-service.yaml
kubectl create -f yaml/spark-master-controller.yaml

启动spark-worker

kubectl create -f yaml/spark-worker-controller.yaml

启动cassandra

kubectl create -f yaml/cassandra-service.yaml
kubectl create -f yaml/cassandra.yaml

启动spark-driver

kubectl create -f yaml/spark-driver.yaml

使用示例

创建keyspace和table


#进入cql命令行

kubectl exec -ti cassandra -- /usr/bin/cqlsh cassandra


#在cql中创建keyspace和table

cqlsh> CREATE KEYSPACE test WITH replication = {'class': 'SimpleStrategy', 'replication_factor': 1 };
cqlsh> CREATE TABLE test.kv(key text PRIMARY KEY, value int);
cqlsh> INSERT INTO test.kv(key, value) VALUES ('key1', 1);
cqlsh> INSERT INTO test.kv(key, value) VALUES ('key2', 2);
cqlsh> select * from test.kv;
key  | value
------+-------
key1 |     1
key2 |     2

使用spark-driver访问cassandra


#进入spark-shell

kubectl exec -ti <spark-pod-name> spark-shell


#访问cassandra，获取test.kv表的大小

scala> sc.stop
scala> import com.datastax.spark.connector._
scala> import org.apache.spark._
scala> val conf = new SparkConf()
scala> conf.set("spark.cassandra.connection.host", "cassandra")
scala> val sc = new SparkContext("local[2]", "Cassandra Connector Test", conf)
scala> val table = sc.cassandraTable("test", "kv")
scala> table.count
res2: Long = 2