Spark 2.0 读写Elasticsearch 6

最新推荐文章于 2022-05-19 20:32:02 发布

小白鸽

最新推荐文章于 2022-05-19 20:32:02 发布

阅读量2.3k

点赞数

分类专栏： Spark 文章标签： Spark2 ES

本文链接：https://blog.csdn.net/baifanwudi/article/details/80258663

版权

Spark 专栏收录该内容

28 篇文章 4 订阅

订阅专栏

本地启动ES,我的版本是ES 6.3.2

maven配置

 <properties>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
        <spark.version>2.1.2</spark.version>
        <hadoop.version>2.6.5</hadoop.version>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-sql_2.11</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.11</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-hive_2.11</artifactId>
            <version>${spark.version}</version>
        </dependency>

        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.elasticsearch</groupId>
            <artifactId>elasticsearch-hadoop</artifactId>
            <version>6.3.2</version>
        </dependency>
     
    </dependencies>

Java 代码如下:


import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SparkSession;
import org.elasticsearch.spark.sql.api.java.JavaEsSparkSQL;

/**
 * @author allen
 * @date 2018/5/9.
 */
public class SparkSqlToEs {

	public static void main(String[] args) {
		SparkSession spark=SparkSession.builder().appName("Sql2Es").config("es.nodes","localhost")
				.config("es.port","9200").master("local[3]").getOrCreate();

		Dataset<Row> person=spark.read().json("/opt/spark/examples/src/main/resources/people.json");

		person.show();

		JavaEsSparkSQL.saveToEs(person,"test/person");

	}
}

curl访问命令或者chrome打开

curl http://localhost:9200/test/person/_search?pretty

就可以看到新增加的数据document.

这里写图片描述

读es表

        Dataset<Row> table= JavaEsSparkSQL.esDF(spark,"trafficwisdom.hot_section/route");
        table.show();
        table.printSchema();

在这里插入图片描述

小白鸽

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Spark 2.0 读写Elasticsearch 6

本地启动ES,我的版本是ES 6.2.4maven配置 &amp;amp;lt;properties&amp;amp;gt; &amp;amp;lt;project.build.sourceEncoding&amp;amp;gt;UTF-8&amp;amp;lt;/project.build.sourceEncoding&amp;amp;gt; &amp;amp;lt;spark.versio
复制链接

扫一扫

专栏目录