Hive 基础及安装
Hive 操作(一)
hive 操作(二)——使用 mysql 作为 hive 的metastore
hive 操作(三)——hive 的数据模型
hive 操作(四)
distinct:去重
视图
使用视图可以屏蔽复杂的操作;
还可进行权限的控制;
hive> create view v1 as select * from t1;
limit clause
Limit 限制查询的记录数,返回的结果是随机选择的,
hive> select * from t1 limit 5;
sort by & order by
sort by
多个 reduce,内部排序
order by
一个 reduce,总排序
Java 操作
Java API 操作之前,必须启动 hive 的远程服务,在 linux 中执行如下的命令:
[root@hadoop0 ~]# hive --service hiveserver >/dev/null 2>/dev/null &
在 hive 1.2 及以上的版本(不再支持 hive),如下更为简洁的命令:
[root@hadoop0 ~]# hiveserver2 &
内置函数 & UDF(User Defined Function)
hive>
# 键入 tab 键会提示是否显示全部的函数信息
hive> describe function substr;
# 相当于 man 操作,输出函数使用信息
hive> select sum(id) from t2;