大批量向Elasticsearch中跑入数据的方式

IT夜幕

已于 2022-01-24 11:34:48 修改

阅读量2.2k

点赞数

分类专栏： Elasticsearch 文章标签： elasticsearch big data 大数据

于 2022-01-23 23:57:44 首次发布

本文链接：https://blog.csdn.net/u013478983/article/details/122659515

版权

Elasticsearch 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一、通过Flink向ES中大批量跑入数据

 public static void main(String[] args) throws Exception {

        // 构建Flink环境对象
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // Source : 数据的输入
        DataStreamSource<String> source = env.socketTextStream("localhost", 9999);

        // 使用ESBuilder构建输出
        List<HttpHost> hosts = new ArrayList<>();
        hosts.add(new HttpHost("127.0.0.1", 9200, "http"));
        ElasticsearchSink.Builder<String> esBuilder = new ElasticsearchSink.Builder<>(hosts,
                 new ElasticsearchSinkFunction<String>() {

                     @Override
                     public void process(String s, RuntimeContext runtimeContext, RequestIndexer requestIndexer) {
                         Map<String, String> jsonMap = new HashMap<>();
                         jsonMap.put("data", s);

                         IndexRequest indexRequest = Requests.indexRequest();
                         indexRequest.index("flink-index");
                         indexRequest.id("9001");
                         indexRequest.source(jsonMap);

                         requestIndexer.add(indexRequest);
                     }
                 });

        // Sink : 数据的输出
        esBuilder.setBulkFlushMaxActions(1);
        source.addSink(esBuilder.build());

        // 执行操作
        env.execute("flink-es");

    }

二、通过Sparkstreaming向ES中跑入大批量数据

 def main(args: Array[String]): Unit = {

        val sparkConf = new SparkConf().setMaster("local[*]").setAppName("ESTest")
        val ssc = new StreamingContext(sparkConf, Seconds(3))

        val ds: ReceiverInputDStream[String] = ssc.socketTextStream("localhost", 9999)
        ds.foreachRDD(
            rdd => {
                rdd.foreach(
                    data => {
                        val client = new RestHighLevelClient(
                            RestClient.builder(new HttpHost("localhost",9200, "http"))
                        )

                        val ss = data.split(" ")

                        val request = new IndexRequest()
                        request.index("product").id(ss(0))
                        val json =
                            s"""
                              | {  "data" : "${ss(1)}" }
                              |""".stripMargin
                        request.source(json, XContentType.JSON)

                        val response: IndexResponse = client.index(request, RequestOptions.DEFAULT)
                        println(response.getResult)
                        client.close()
                    }
                )
            }
        )

        ssc.start()
        ssc.awaitTermination()
    }

三、通过Kafka向ES中跑入数据

 public static void main(String[] args) throws Exception {
                   BulkRequest bulkRequest = new BulkRequest();
                    //初始化 ack
                    List<Acknowledgment> acks = new LinkedList<>();
                    Message<String> message = messages.poll();
                    DataEsSinker.reduceQueueSize(message.getPayload());

                    Acknowledgment acknowledgment = message.getHeaders().get(KafkaHeaders.ACKNOWLEDGMENT, Acknowledgment.class);

                    Map source = jackSon.readValue(message.getPayload(), Map.class);
                    String id = source.get("_id") == null ? "" : source.get("_id").toString();
                  
                    if (StringUtils.isNotBlank(id) ) {
                            bulkRequest.add(new UpdateRequest(this.indexName, "doc", URLEncoder.encode(id, "utf-8")).doc(source).upsert(source));
                                acks.add(acknowledgment);
                     }
                   if (bulkRequest.numberOfActions() > 0) {  
                     if (bulkResponse.hasFailures()) {
                                    for (Acknowledgment acknowledgment : acks) {
                                        if (acknowledgment != null) {
                                            acknowledgment.acknowledge();
                                        }
                                    }  
                           }         
                     }               
 }