![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
黑尾土拨鼠
远处的是风景,近处的才是人生
展开
-
Spark实战(六)spark SQL + hive(Python版)
一、hive环境准备1、安装hive 按照hive安装步骤安装好hiveCREATE USER 'spark'@'%' IDENTIFIED BY '123456';GRANT all privileges ON hive.* TO 'spark'@'%';flush privileges;2、环境配置 将配置好的hive-site.xml放入$SPARK-HOME/...原创 2019-01-10 13:54:29 · 9497 阅读 · 0 评论 -
hadoop实战(七)hiveserver2无法启动
hive配置后无法正常启动解决步骤1.修改core-site.xml core-site.xml增加如下内容:<property> <name>hadoop.proxyuser.root.hosts</name> <value>*</value></property><pr...原创 2019-02-19 15:55:38 · 6569 阅读 · 0 评论 -
hadoop实战(八)hive常用函数及练习小示例
首先准备三个表的数据student表—学生基本信息 新建一个student.txt文件,增加如下内容:95001,李勇,男,20,CS95002,刘晨,女,19,IS95003,王敏,女,22,MA95004,张立,男,19,IS95005,刘刚,男,18,MA95006,孙庆,男,23,CS95007,易思玲,女,19,MA95008,李娜,女,18,CS95009,梦...原创 2019-02-25 16:24:18 · 687 阅读 · 0 评论 -
Spark实战(十一)Spark2.x集成Hive
一、Hive配置(一)、简介 一般的公司都会有自己的数据仓库,而大多数都选择的Hive数据仓库,总所周知hive默认使用MapReduce来进行数据操作,MapReduce在计算过程中会涉及数量巨大的网络传输,这需要耗费大量的时间,在计算过程中会反复读写磁盘,极其耗时,因此使用spark来计算可以提高效率,但是之前有很多数据都是通过hive来操作,好在spark可以无缝集成hive,使用h...原创 2019-04-03 17:48:31 · 1074 阅读 · 0 评论