hive循环语句_Hive 如何方便地实现存储过程？

最新推荐文章于 2022-03-05 00:04:32 发布

weixin_39799565

最新推荐文章于 2022-03-05 00:04:32 发布

阅读量700

点赞数

文章标签： hive循环语句执行存储过程授权

第一种是 HPL/SQL。这种方式目前还不完善，比如游标使用限制多，很多功能无法实现，对变量要求严格，经常发生不兼容的错误。只要可调试，代码报错并非障碍，但 HPL/SQL 的问题在于不可调试，对于开发者就很不方便。

更不方便的是，HPL/SQL 缺乏 JDBC 接口，无法方便地嵌入 JAVA 程序，只能在 JAVA 中调用命令行执行 HPL/SQL，再由 HPL/SQL 实施计算并将结果回写 Hive 临时表，最后 JAVA 通过 Hive 的 JDBC 读取临时表。

第二种是用 JAVA 开发的 UDF 间接实现。JAVA 缺乏结构化计算类库，所有的算法都要硬编码，比如最基本的二维表要用 ArrayList+HashMap 组合实现，最简单的分组汇总要写几十行，关联计算更是冗长繁琐。由于硬编码很难统一规则，所以即使相似的业务逻辑，具体算法也是千差万别，这就导致代码可读性差、维护困难。

JAVA 存储过程还存在高耦合性的问题。JAVA 类无法进行热部署，每次修改都要重新编译并重启 Hive 服务，这会对生产环境产生严重影响。如果设计一个巧妙的结构，也许能降低耦合性，但项目成本必然大幅上升。

如果使用集算器，实现 Hive 存储过程就会方便很多。

集算器具有丰富的结构化类库，无论查询、排序、聚合还是分组汇总、关联查询，都可以用内置函数直接实现。集算器也提供了针对结构化数据的分支判断、循环语句、动态语法，复杂业务逻辑也可轻松实现。集算器允许设置断点、跟踪调试，以便程序员快速排错。向上接口方面，集算器提供了标准的 JDBC 驱动，供 JAVA 代码调用，实际的存储过程则以脚本文件的形式存在，修改存储过程不影响 JAVA 代码或 Hive 服务。向下接口方面，集算器除了支持标准的 Hive JDBC，还提供了更高性能的私有接口，两者都可执行 HSQL 语句。

例子：Hive 中 sales 表按销售、年、月分组汇总后如下：

存储过程算法：调整每个销售 Q1Q2 的账务，具体是将 4 月份的 1000 元转移到 3 月份。要求对同一个销售同一年的数据做调整，如果 3 月份缺失，则调整时需在 3 月份追加 -1000 的空记录，以便平衡账务，如果 4 月份缺失，则调整时在 4 月份追加 1000 的空记录，都缺失则不做调整。

计算结果应当如下：

集算器存储过程如下：

关于集算器 JDBC 接口，可以参 Java 如何调用 SPL 脚本
关于集算器安装使用、获得免费授权和相关技术资料，可以参如何使用集算器？。

weixin_39799565

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive循环语句_Hive 如何方便地实现存储过程？

第一种是 HPL/SQL。这种方式目前还不完善，比如游标使用限制多，很多功能无法实现，对变量要求严格，经常发生不兼容的错误。只要可调试，代码报错并非障碍，但 HPL/SQL 的问题在于不可调试，对于开发者就很不方便。更不方便的是，HPL/SQL 缺乏 JDBC 接口，无法方便地嵌入 JAVA 程序，只能在 JAVA 中调用命令行执行 HPL/SQL，再由 HPL/SQL 实施计算并将结果回写 Hi...
复制链接

扫一扫

hive循环语句_Hive 如何方便地实现存储过程？

“相关推荐”对你有帮助么？