hive 同步数据到ES

本文介绍了如何将Hive数据同步到Elasticsearch(ES)的过程。首先,需要下载elasticsearch-hadoop的jar包,并将其放在Hadoop的jars目录下。接着,在Hive中创建与ES匹配的表结构。然后,通过插入Hive表的数据来实现同步。在遇到错误时,可能需要添加commons-httpclient-3.0.1.jar到Hive环境。最后,可以通过ES的资源名查看已同步的索引。
摘要由CSDN通过智能技术生成

目录

 

1.相关jar包

2.添加jar包到hive中

 2.1 放置jar到hadoop

​ 2.2 创建hive表

3. 插入数据到hive表

4.查看ES中索引


1.相关jar包

 elasticsearch-hadoop-5.5.1.jar 下载地址:http://download.elastic.co/hadoop/

到官网下载与ES一致的版本,比如ES版本是5.5.1,则下载elasticsearch-hadoop-5.5.1.zip

jar包就在压缩包dist目录中。

 

2.添加jar包到hive中

 2.1 放置jar到hadoop

   如下是放到hadoop根目录的jars目录下

[hadoop@master lib]$ hadoop  fs -put elasticsearch-hadoop-5.5.1.jar  /jars/

 2.2 创建hive表

 语法参考https://www.elastic.co/guide/en/elasticsearch/hadoop/current/hive.html

 可根据版本查看

 CREATE TABLE `emptoes2`(              
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值