ORACLE存储过程如何迁移到HIVE?

在将ORACLE存储过程迁移到HIVE平台时,不可避免地会遇到各种问题。

ORACLE与HIVE都使用SQL语句,但是语法和特性不尽相同,本文简述了几个迁移时需要注意的地方。

一.INSERT语句

ORACLE:

EXECUTE IMMEDIATE 'TRUNCATE TABLE TABLE_A';
INSERT /*+APPEND*/ INTO A NOLOGGING (
COL_1,
COL_2,
COL_3,
)

 

迁移至HIVE语句为:

INSERT OVERWRITE TABLE TABLE_A;

OVERWRITE关键字声明插入数据时覆盖原有数据,和TRUNCATE清空表数据再INSERT效果相同。

注意HIVE插入表时不能指定插入的字段,因为HIVE存储的是非结构化的数据。

 

二.表关联

ORACLE:

SELECT /*+PARALLEL (A,8)*/ 
*
FROM  A, B ,C
WHERE A.COL_1 = B.COL_1(+)
AND A.COL_1 = C.COL_1(+)

 

迁移至HIVE语句为:

SELECT *
FROM  A 
LEFT OUTER JOIN B
ON A.COL_1 = B.COL_1
LEFT OUTER JOIN C 
ON A.COL_1 = C.COL_1


ORACLE注释/*+PARALLEL (A,8)*/需要删除,左关联的语法需要改为HIVE的关联语法。

ORACLE和HIVE的各种关联语法对比,请移步

http://blog.csdn.net/henryfabrgeas/article/details/24689935

 

三.表的别名

ORACLE:

SELECT * FROM 
(SELECT * FROM A) 
GROUP BY COL_1


当需要类似的子查询语句时,迁移至HIVE时需要给子查询起别名,否则会报语法错误。

迁移至HIVE语句为:

SELECT * FROM 
(SELECT * FROM A) B 
GROUP BY B.COL_1


四.HIVE特性

在迁移的时候,会遇到一些HIVE的特性导致无法顺利迁移,如下ORACLE语句:

SELECT *
FROM A
GROUP BY A.COL_1
HAVING COUNT(DISTINCT A.COL_2) = 2

在HIVE中运行会遇到如下报错:

FAILED: SemanticException [Error 10002]: Line 19:22 Invalid column reference 'COL_2'

去掉DISTINCT后可以正常执行。

属于HIVE的特性导致的问题,HAVING子句中无法使用DISTINCT关键字,在迁移中需要进行取舍。

五.报错

1.迁移后字段数据类型有误,需要修改数据类型。

FAILED: SemanticException [Error 10016]: Line 28:5 Argument type mismatch 'COL_1': The expression after ELSE should have the same type as those after THEN: "int" is expected but "double" is found


2.

org.apache.hadoop.hive.ql.parse.SemanticException: Big Table Alias is null

关联时主表数据为空,需要插入数据再进行测试。

  • 3
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
将数据从Oracle数据库迁移Hive中可以采用以下步骤: 1.安装Hive,配置Hive环境变量 2.安装Sqoop,配置Sqoop环境变量 3.创建Hive表结构 4.使用Sqoop将Oracle数据导入到Hive中 具体步骤如下: 1.安装Hive,配置Hive环境变量 需要下载并安装Hive,然后配置Hive环境变量。可以参考Hive的官方文档进行安装和配置。 2.安装Sqoop,配置Sqoop环境变量 需要下载并安装Sqoop,然后配置Sqoop环境变量。可以参考Sqoop的官方文档进行安装和配置。 3.创建Hive表结构 需要先在Hive中创建表结构,以便后续将Oracle数据导入到Hive中。可以使用Hive的DDL语句进行创建表结构,例如: ``` CREATE TABLE employee ( id INT, name STRING, age INT, gender STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE; ``` 4.使用Sqoop将Oracle数据导入到Hive中 使用Sqoop将Oracle数据导入到Hive中,可以使用以下命令: ``` sqoop import \ --connect jdbc:oracle:thin:@//hostname:port/service_name \ --username username \ --password password \ --table oracle_table_name \ --hive-import \ --hive-table hive_table_name \ --fields-terminated-by ',' \ --lines-terminated-by '\n' ``` 其中,`--connect`指定Oracle数据库的连接信息,`--username`和`--password`指定Oracle数据库的用户名和密码,`--table`指定要导入的Oracle表名,`--hive-import`指定要将数据导入到Hive中,`--hive-table`指定要导入到的Hive表名,`--fields-terminated-by`指定Oracle表中字段之间的分隔符,`--lines-terminated-by`指定Oracle表中行之间的分隔符。 例如,如果要将Oracle数据库中的`employee`表导入到Hive中的`employee`表中,可以使用以下命令: ``` sqoop import \ --connect jdbc:oracle:thin:@//localhost:1521/orcl \ --username scott \ --password tiger \ --table employee \ --hive-import \ --hive-table employee \ --fields-terminated-by ',' \ --lines-terminated-by '\n' ``` 这样就可以将Oracle数据成功导入到Hive中了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值