11.8 spark SQL读取hive数据

最新推荐文章于 2024-06-01 08:53:20 发布

心雨先生

最新推荐文章于 2024-06-01 08:53:20 发布

阅读量1.6k

点赞数 1

分类专栏：大数据-Spark 文章标签： spark SQL hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011418530/article/details/81628997

版权

大数据-Spark 专栏收录该内容

37 篇文章 0 订阅

订阅专栏

1，启动hdfs集群

2，启动hive

create database testdb 创建testdb库

关闭hive保留关键字检查功能：

set hive.support.sql11.reserved.keywords=false

创建一张userlog表：

CREATE TABLE IF NOT EXISTS testdb.userlog(

date string ,

timestamp string ,

user_id string ,

page_id string ,

channel string ,

action string

)

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' ;

表中插入数据：加载本地数据到hive

load data local inpath '/root/resource/userLog' into table testdb.userlog;

hive中的测试操作：是用来和Spark core性能对比

查询page的PV

SELECT date,page_id,count(*) pv FROM userlog WHERE action = 'View' GROUP BY date, page_id ORDER BY pv DESC LIMIT 10;

查询page的UV

SELECT date, page_id, count(distinct(user_id)) uv FROM userlog WHERE action = 'View' GROUP BY date,page_id ORDER BY uv DESC LIMIT 3;

最热门的channel

SELECT date,channel,count(*) channelpv FROM userlog WHERE action = 'View' GROUP BY date, channel ORDER BY channelpv DESC LIMIT 10;

spark core操作：

1，启动spark

2，开启Hive的metaStore服务在~目录下 ./startHiveMetastoreService.sh启动

3，启动spark core ： ./spark-shell --master spark://node1:7077 --total-executor-cores 3

4、import org.apache.spark.sql.hive.HiveContext

val hc = new HiveContext(sc)

hc.sql("show databases").show //查看数据库结构

hc.sql("use testdb").show //切换到testdb库

hc.sql("SELECT date,page_id,count(*) pv FROM userlog WHERE action = 'View' GROUP BY date, page_id ORDER BY pv DESC LIMIT 10").show

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
11.8 spark SQL读取hive数据

1，启动hdfs集群2，启动hivecreate database testdb 创建testdb库关闭hive保留关键字检查功能：set hive.support.sql11.reserved.keywords=false创建一张userlog表：CREATE TABLE IF NOT EXISTS testdb.userlog(date string ,time...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。