--hive 不支持记录级别的更新、插入或者删除操作。(但是用户可以通过查询生成新表,或者将查询结果导入到文件中)
update不同。oracle中用 update...set...但hive中没有‘update’。可以打开‘file
browser’,删除相应文件,再用记事本重新上传,上传之后需要‘让hive知道发生了这个更新',这里需要一行代码 analyze table table_name compute
statistics
删除的方式不同。
--字符串连接符不同。
有的时候,我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的:
MySQL: CONCAT()
Oracle: CONCAT(), ||
SQL Server: +
CONCAT() 的语法如下:
CONCAT(字串1, 字串2, 字串3,
...):
将字串1、字串2、字串3,等字串连在一起。请注意,Oracle的CONCAT()只允许两个参数;换言之,一次只能将两个字串串连起来。不过,在Oracle中,我们可以用'||'来一次串连多个字串。
--注释掉的方式不同
oracle可以用两种方式 ‘ ’和‘--’
hive中只可以使用‘--’(多行注释掉还不会快捷键。。)
--level connect by
oracle中可以使用level connect by 和dual表 创造自增数列,而hive中不支持这些。
oracle中:
select level n
from dual connect by level <=20;
hive中:
create table dual as
with sub as (
select att.id_source
from owner_dwh.f_call_attempt_td att
where att.date_call = '2017-12-03'
limit 1000
)
select row_number() over (order by sub.id_source) as n
from sub;
hive中可以利用row_number函数对一个已有表的primary
key进行排序,从而得到最简单数列 1,2,3,4,...
--hive中 不支持having 和 distinct 出现在同一语句中
例如:
SELECT
*
FROM A
GROUP BY
A.COL_1
HAVING
COUNT(DISTINCT A.COL_2) = 2
在oracle中可以正常运行,但在HIVE中运行会有如下报错:
FAILED: SemanticException [Error 10002]: Line 19:22 Invalid
column reference 'COL_2'
去掉DISTINCT后可以正常执行。
属于HIVE的特性导致的问题,HAVING子句中无法使用DISTINCT关键字,在迁移中需要进行取舍。