由于开发工作的需要把数据从Hive导入到Elasticsearch,最开始使用了java写了个程序跑数据,80W的数据跑了2个小时左右,想想1000W数据那得要一天的时间,这效率到一次痛苦一次,就放弃了最初的想法,找到了用了hive的的方法,直接把数据导入到elasticsearch,以下是创建过程。
1,准备工作,准备jar包elasticsearch-hadoop-7.1.1,org.apache.commons.httpclient-3.1.jar
2,在hive中添加jar包。
3,建立一张和es连接的表hiveToEsTable.
1 CREATE EXTERNAL TABLE temp.hiveToEsTable (2 id,3 uscc string,4 remov_dt string,5 lpr_cert_num string,6 cont_tel string,7 license_no string,8 license_item string,9 license_begin_dt string,10 license_end_dt string,11 license_fz_dt string,12 license_certi_stat string,13 remov_reas string,14 KEY string
15 ) STORED BY 'org.elasticsearch.hadoop.hive.EsStorageHandler'TBLPROPERTIES (16 ##es的索引17 'es.resource' = 'es_index',18 ##es的id19 'es.m