hive常用建表命令整理。

近日学习hive过程中,其基本操作与MySQL类似,不做赘述;特别的,针对一些hive中的建表命令进行了整理。

其中相关内容来源于徐培成老师的大数据课程,望周知。


    //创建表,external 外部表
    $hive>CREATE external TABLE IF NOT EXISTS t2(id int,name string,age int) COMMENT 'xx' ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE ; 

    //查看表数据
    $hive>desc t2 ;
    $hive>desc formatted t2 ;

    //加载数据到hive表
    $hive>load data local inpath '/home/xxx/customers.txt' into table t2 ;          //local上传文件
    $hive>load data inpath '/user/xxx/customers.txt' [overwrite] into table t2 ;    //移动文件

    //复制表
    mysql>create table tt as select * from users ;        //携带数据和表结构
    mysql>create table tt like users ;            //不带数据,只有表结构

    hive>create table tt as select * from users ;    
    hive>create table tt like users ;    


    //count()查询要转成mr
    $hive>select count(*) from t2 ;
    $hive>select id,name from t2 ;


    //
    $hive>select * from t2 order by id desc ;                //MR
        
    //启用/禁用表
    $hive>ALTER TABLE t2 ENABLE NO_DROP;    //不允许删除
    $hive>ALTER TABLE t2 DISABLE NO_DROP;    //允许删除


    //分区表,优化手段之一,从目录的层面控制搜索数据的范围。
    //创建分区表.
    $hive>CREATE TABLE t3(id int,name string,age int) PARTITIONED BY (Year INT, Month INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;

    //显式表的分区信息
    $hive>SHOW PARTITIONS t3;

    //添加分区,创建目录
    $hive>alter table t3 add partition (year=2014, month=12);
    
    //删除分区
    hive>ALTER TABLE employee_partitioned DROP IF EXISTS PARTITION (year=2014, month=11);

    //分区结构
    hive>/user/hive/warehouse/mydb2.db/t3/year=2014/month=11
    hive>/user/hive/warehouse/mydb2.db/t3/year=2014/month=12


    //加载数据到分区表
    hive>load data local inpath '/home/centos/customers.txt' into table t3 partition(year=2014,month=11);

    //创建桶表
    $hive>CREATE TABLE t4(id int,name string,age int) CLUSTERED BY (id) INTO 3 BUCKETS ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;
    
    //加载数据不会进行分桶操作
    $hive>load data local inpath '/home/centos/customers.txt' into table t4 ;
    
    //查询t3表数据插入到t4中。
    $hive>insert into t4 select id,name,age from t3 ;

    //桶表的数量如何设置?
    //评估数据量,保证每个桶的数据量block的2倍大小。


    //连接查询
    $hive>CREATE TABLE customers(id int,name string,age int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;
    $hive>CREATE TABLE orders(id int,orderno string,price float,cid int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;

    //加载数据到表
    //内连接查询
    hive>select a.*,b.* from customers a , orders b where a.id = b.cid ;
    //左外
    hive>select a.*,b.* from customers a left outer join orders b on a.id = b.cid ;
    hive>select a.*,b.* from customers a right outer join orders b on a.id = b.cid ;
    hive>select a.*,b.* from customers a full outer join orders b on a.id = b.cid ;

    //explode,炸裂,表生成函数。
    //使用hive实现单词统计
    //1.建表
    $hive>CREATE TABLE doc(line string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值