Spark学习笔记之-Spark-cassandra-connector阅读

最近使用Spark将处理数据存储到cassandra遇到些问题,于是乎大体看了下spark-cassandra-connector的源码

这是该项目的主页:https://github.com/datastax/spark-cassandra-connector ,上面的document有一些例子的用法。


使用时加入依赖

    <dependency>
      <groupId>com.datastax.spark</groupId>
      <artifactId>spark-cassandra-connector_2.10</artifactId>
      <version>1.4.0-M3</version>
    </dependency>
和引入

import com.datastax.spark.connector._

1.4.0-M3这个版本spark与cassandra连接使用的是连接池,避免每次写入数据频繁连接,一下是阅读代码的一些主要流程,粗略阅读,可能会存在一些问题,欢迎指正!




实际上流程不复杂,这里主要罗列了连接池的一些步骤,数据写入和rdd任务调度等没有做详细分析。

值得注意的是:

1.sessionCache(连接池)存储的是K,V对,通过_config(即spark_conf)作为key来查询session的。

2.session有超时时间,可适当调整延长等待时长,来保证连接能被复用。一下两种方式修改:

a. 在提交时通过  --driver-java-options "-Dspark.cassandra.connection.keep_alive_ms=2000"   //毫秒级,此处为2s

b. 修改spark-defaults.conf  加入spark.cassandra.connection.keep_alive_ms        2000




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值