Hive入门(三)

一.Hive中Mysql的引入
1.Hive为啥要依赖一个数据库?
Hive的源数据字段的映射,并且源数据的存储信息,文件序列需要存储在数据库中进行说明.
2.为啥Hive要借助关系型数据库?
Hive的元数据默认保存在debey数据库中,debey数据库只能单用户登陆,业务效率不高,所以需要借助mysql,oracle这类型的关系型数据库.
3.Service mysql status 查看mysql状态
Service mysql start/stop 开启关闭
4.设置mysql的密码
set password for root@localhost=password(“123”);
5.mysql root用户默认只能在本地登陆,所以设置root可以在任意位置进行登陆
grant all privileges on *.* to ‘root’@’%’ identified by ‘root’ with grant option;
6.flush privileges MySQL设置完成之后需要刷新.
二.Hive中表的三种创建方式:
1.create table emp(empno int) row format delimited fields terminated by ‘\t’;
2.子查询创建
create table emp as select empno from emp;
3.like方式
create table emp_like like emp;
只会创建和emp表结构相同的一张新表,不会复制内容.
三.Hive表导入数据方式
1.本地导入
load data local inpath ‘local_path’ into table table_name;
会自己创建递归目录的
2.HDFS导入
load data inpath ‘hdfs_path’ into table table_name;
3.覆盖导入
load data local inpath ‘path_file’ overwrite into table table_name;
load data inpath “hdfs_file” overwrite into table table_name;
4.查询导入
create table table_name as select * from anothertable_name;
5.insert导入
insert into table table_name select * from anothertable_name;
如果导入两边,会有两份数据,因为默认是追加数据的.
如果想要覆盖,要显示指定
insert overwrite table 表名 select * from track_log;

四.Hive表数据导出的方式
1.本地导出
insert overwrite local directory “/home/hadoop/emp” row format delimited fields terminated by ‘\t’ select * from company.emp;
2.HDFS导出
insert overwrite directory “path/” select * from emp;

五:Hive中的几种排序
1.order by
全局排序,就一个Reduce
2.sort by
相当于对每一个Reduce内部的数据进行排序,不是全局排序
3.distribute by
类似于MR中的partition,进行分区,一般要结合sort by 使用.
4.cluster by
当distribute和sort字段相同时候,就是cluster by.
例如:
先设置mapreduce的个数
set mapreduce.job.reduces = 3;
insert overwrite local directory ‘/home/hadoop/result/sort’ row format delimited fields terminated by “\t” select * from emp distribute by deptno sort by empno;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值