Spark SQL 集成ElasticSearch的案例实战

Spark SQL 集成ElasticSearch的案例实战

ElasticSearch 概念回顾

ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

Spark与ElasticSearch的集成

Java版本

public class SparkESJavaOps {
    public static void main(String[] args) {
        SparkConf conf = new SparkConf().setAppName(SparkESJavaOps.class.getSimpleName()).setMaster("local");
        //在spark中自动创建es中的索引
        conf.set("es.index.auto.create","true");
        //设置在spark中连接es的url和端口
        conf.set("es.nodes","master");
        conf.set("es.port","9200");
        JavaSparkContext sc = new JavaSparkContext(conf);
        JavaRDD<String>  jsonRDD = sc.textFile("E:/test/scala/sqldf.json");
        //向es中插入数据
        JavaEsSpark.saveJsonToEs(jsonRDD,"spark3/person");
        //从es中查询数据
        /***
         * es索引库的三级目录
         * index/type/id
         * es
         * index -->db
         * type -->table
         * document -->row
         * field --> column
         * esJsonRDD 返回的数据JavaPairRDD <String,String> -->t._1就是es中每一个document的id,唯一标识
         * t._2就是document数据
         * */
        JavaEsSpark.esJsonRDD(sc,"spark3/person").foreach(new VoidFunction<Tuple2<String, String>>(){
            @Override
            public void call(Tuple2<String, String> tuple) throws Exception {
                System.out.println(tuple._1()+" ===> " +tuple._2());
            }
        });

    }
}

Scala版本

/**
  * Spark 与 ES 的集成
  */
object SparkESOps extends App{
  val conf  = new SparkConf().setAppName("SparkESOps").setMaster("local")
  //在spark中自动创建es中的索引
  conf.set("es.index.auto.creaete","true")
  //设置在Spark 中连接 es的url和端口
  conf.set("es.nodes","master")
  conf.set("es.port","9200")
  val sc = new SparkContext(conf)

  //向es中写入数据
  val linesRDD = sc.textFile("E:/test/scala/sqldf.json")
  //这里面参数resources指定的就是es中的索引库和类型格式为:index/type
  linesRDD.saveJsonToEs("spark2/person")
  //查询数据
  val personRDD = sc.esJsonRDD("spark2/person")
  personRDD.foreach(println)

  sc.stop()

}
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值