好程序员大数据培训分享之hive存储过程,1、hive存储过程简介1.x版本的hive中没有提供类似存储过程的功能,使用Hive做数据开发时候,一般是将一段一段的HQL语句封装在Shell或者其他脚本中,然后以命令行的方式调用,完成一个业务或者一张报表的统计分析。好消息是,现在已经有了Hive存储过程的解决方案(HPL/SQL –Procedural SQL on hadoop),并且在未来的Hive的版本(2.0)中,会将该模块集成进来。该解决方案不仅支持Hive,还支持在SparkSQL,其他NoSQL,甚至是RDBMS中使用类似于Oracle PL/SQL的功能,这将极大的方便数据开发者的工作,Hive中很多之前比较难实现的功能,现在可以很方便的实现,比如自定义变量、基于一个结果集的游标、循环等等。
2、hplsql安装和存储过程案例
下载:
官网下载地址:http://www.hplsql.org/download
0.3.31版本下载地址:http://www.hplsql.org/downloads/hplsql-0.3.31.tar.gz
安装hplsql:
[root@hadoop01 home]# tar -zxvf /home/hplsql-0.3.31.tar.gz -C /usr/local/
[root@hadoop01 home]# cd /usr/local/hplsql-0.3.31/
配置hplsql:
vi ./hplsql
内容如下:
#!/bin/bash
export “HADOOP_CLASSPATH= H A D O O P C L A S S P A T H : HADOOP_CLASSPATH: HADOOPCLASSPATH:HADOOP_HOME/lib/*”
export “HADOOP_CLASSPATH= H A D O O P C L A S S P A T H : HADOOP_CLASSPATH: HADOOPCLASSPATH:HADOOP_CONF_DIR/”
export “HADOOP_CLASSPATH= H A D O O P C L A S S P A T H : HADOOP_CLASSPATH: HADOOPCLASSPATH:HADOOP_HOME/share/hadoop/mapreduce/*”
export “HADOOP_CLASSPATH= H A D O O P C L A S S P A T H : HADOOP_CLASSPATH: