关闭

hive基础命令

156人阅读 评论(0) 收藏 举报
分类:
命令 描述
reset 重置配置为默认值
set 输出用户覆盖的hive配置变量
set -v 输出所有Hadoop和Hive的配置变量
add FILE[S] <filepath> <filepath>* 
add JAR[S] <filepath> <filepath>* 
add ARCHIVE[S] <filepath> <filepath>* 添加 一个或多个 file, jar,  archives到分布式缓存
list FILE[S] 
list JAR[S] 
list ARCHIVE[S] 输出已经添加到分布式缓存的资源。
list FILE[S] <filepath>* 
list JAR[S] <filepath>* 
list ARCHIVE[S] <filepath>* 检查给定的资源是否添加到分布式缓存
delete FILE[S] <filepath>* 
delete JAR[S] <filepath>* 
delete ARCHIVE[S] <filepath>* 从分布式缓存删除指定的资源
! <command> 从Hive shell执行一个shell命令
dfs <dfs command> 从Hive shell执行一个dfs命令
<query string> 执行一个Hive 查询,然后输出结果到标准输出
source FILE <filepath> 在CLI里执行一个hive脚本文件


session = database 'session:/';
--使用session数据库,session数据库是一个内存数据库
use session; 
add file /home/queryengine/idlist.txt;create table tblID(id name);
load data local inpath "idlist.txt" overwrite into table tblID;
use default;
 -- 切换为默认的数据库
select * from src left semi join session.tblID tmp where src.name=tblID.id; 
--QE目前不支持in的子查询操作,可以使用 left semi join来代替。


注:Table与External Table的区别
Table在加载数据的过程中,实际数据会被移动到数据仓库目录中;之后对数据对访问将会直接在数据仓库目录中完成。删除表时,表中的数据和元数据将会被同时删除。
External Table加载数据和创建表同时完成(CREATE EXTERNAL TABLE ……LOCATION),实际数据是存储在 LOCATION 后面指定的 HDFS 路径中,并不会移动到数据仓库目录中。


hdfs -v dfs -copyFromLocal On_Time_On_Time_Performance_*.csv /data/ontime/



0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:237708次
    • 积分:5237
    • 等级:
    • 排名:第5229名
    • 原创:283篇
    • 转载:89篇
    • 译文:4篇
    • 评论:4条