![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive相关
yongjian_luo
这个作者很懒,什么都没留下…
展开
-
Hive-sql的特性
Hive-sql与pl-sql相比,具有一些自己的特点,但大部分都与pl-sql兼容,下面是他们之间的不同之处: •读时验证,与关系型数据库的写时验证不同 •统计和查询操作都会转换成MR任务执行,除select * from tablename外 • 一个Hive任务可能转换成一个或者几个MR任务执行 • 保留sql语言对order by,group by的支持 • 增加了sort原创 2013-07-25 11:09:13 · 1234 阅读 · 0 评论 -
Hive的行分隔符<转>
Hive下做类型强制转换:cast(s as INT); 对于简单数据类型,Hive不区分大小写; Hive支持三种集合数据类型,struct,map和array; 对于文本文件,每一行表示一条记录,换行符(\n)是默认的记录分隔符,通常不需要显示指定LINES TERMINATED BY '\n',因为Hive目前不支持除了'\n'以外的行分隔符; 如果所传统数据库属于“转载 2013-09-22 18:23:00 · 3585 阅读 · 0 评论 -
Hive视图<转>
Hive 0.6版本及以上支持视图 Hive View具有以下特点: 1. View是逻辑存在,Hive暂不支持物化视图(1.0.3) 2. View只读,不支持LOAD/INSERT/ALTER。需要改变View定义,可以是用Alter View 3. View内可能包含ORDER BY/LIMIT语句,假如一个针对view的查询也包含这些语句, 则view中的语句优先级高。例如,定义v转载 2014-07-04 15:51:48 · 814 阅读 · 0 评论 -
Hive中的LEFT SEMI JOIN<转>
LEFT SEMI JOIN 是 IN/EXISTS 子查询的一种更高效的实现。 Hive 当前没有实现 IN/EXISTS 子查询,所以你可以用 LEFT SEMI JOIN 重写你的子查询语句。LEFT SEMI JOIN 的限制是, JOIN 子句中右边的表只能在 ON 子句中设置过滤条件,在 WHERE 子句、SELECT 子句或其他地方过滤都不行。转载 2014-06-16 17:01:00 · 695 阅读 · 0 评论 -
hive 中的Sort By、 Order By、Cluster By、Distribute By 区别<转>
Order by: order by 会对输入做全局排序,因此只有一个reducer(多个reducer无法保证全局有序) 只有一个reducer,会导致当输入规模较大时,需要较长的计算时间。 在hive.mapred.mode=strict模式下,强制必须添加limit限制,这么做的目的是减少reducer数据规模 Sort by: sort by不是全局排序,其在数据转载 2014-10-31 11:54:43 · 612 阅读 · 0 评论