使用spark访问elasticsearch的数据

最新推荐文章于 2024-01-28 14:33:05 发布

ggzone

最新推荐文章于 2024-01-28 14:33:05 发布

阅读量7.1k

点赞数

分类专栏： ELK Hive 文章标签： spark elasticsearch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ggz631047367/article/details/50445790

版权

Hive 同时被 2 个专栏收录

17 篇文章 0 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

使用spark访问elasticsearch的数据，前提是spark能访问hive，hive能访问es
http://blog.csdn.net/ggz631047367/article/details/50445832

1.配置

cp elasticsearch-hadoop-2.1.1/dist/elasticsearch-hadoop-2.1.1.jar /usr/local/spark-1.5.2/lib/

2.修改配置文件/usr/local/spark/conf/hive-site.xml,添加

<property>
  <name>hive.aux.jars.path</name>
  <value>file:///usr/local/spark-1.5.2/lib/elasticsearch-hadoop-2.1.1.jar</value>
  <description>A comma separated list (with no spaces) of the jar files</description>
</property>

3.配置/usr/local/hive-1.2.1/lib/mysql-connector-java-5.1.31-bin.jar,在spark-env.sh添加

export SPARK_CLASSPATH=$SPARK_CLASSPATH:/usr/local/hive-1.2.1/lib/mysql-connector-java-5.1.31-bin.jar

4.启动

sbin/start-thriftserver.sh   --hiveconf hive.server2.thrift.port=10000  --hiveconf hive.server2.thrift.bind.host=hadoop-master     --master spark://10.8.2.100:7077  --jars /usr/local/spark-1.5.2/lib/elasticsearch-hadoop-2.1.1.jar

或者

bin/spark-sql –master spark://10.8.2.100:7077 –jars /usr/local/spark-1.5.2/lib/elasticsearch-hadoop-2.1.1.jar

5.测试

beeline -u jdbc:hive2://10.8.2.100:10000 (稍等一下执行此命令，报错有可能是服务还没起来)

select count(dtime) from achi_ex limit 10;

注意：–driver-class-path和–jars的区别，使用sbin/start-thriftserver.sh -h查看
如果1中拷贝到所有slave中spark/lib中，后面不用—jars指定jar包

这种方式比直接访问hive中的数据慢一倍左右

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
使用spark访问elasticsearch的数据

使用spark访问elasticsearch的数据
复制链接

扫一扫

专栏目录

ggzone CSDN认证博客专家 CSDN认证企业博客

码龄14年

203: 原创

10万+: 周排名

48万+: 总排名

99万+: 访问

: 等级

1万+: 积分

103: 粉丝

68: 获赞

163: 评论

158: 收藏

私信

关注

热门文章

分类专栏

最新评论

g++多文件编译
花卷gem': 你真的是小天使
C++11 类的六个默认函数及其使用
yong1585855343: 原来没有移动拷贝构造………………，我今天面试的时候还回答了移动拷贝构造！！
Ubuntu14.04下hadoop-2.6.0单机配置和伪分布式配置
羊驼草草: 你好，请问配置mapred-site.xml文件是不是路径错了啊，按照你前面的步骤好像是 sudo gedit /usr/local/hadoop/etc/hadoop/mapred-site.xml 这个，还有yarn-site.xml和mapred-site.xml里面的内容也有点问题，配完打不开 http://localhost:8088
修改hive内存限制
liiiiiiiiiiiii123: 怎么会有这个烂的答案，
java通过jdbc连接impala
qq_38896400: 你好，请问您解决了吗，

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。