03：Hive从0到1系列学习：DML数据操作语言

最新推荐文章于 2022-08-29 22:36:23 发布

牧码文

最新推荐文章于 2022-08-29 22:36:23 发布

阅读量1.2k

点赞数 1

分类专栏： hive hadoop 文章标签： hive hadoop big data

本文链接：https://blog.csdn.net/weixin_46429290/article/details/122059183

版权

hive 同时被 2 个专栏收录

61 篇文章 4 订阅

订阅专栏

hadoop

46 篇文章 2 订阅

订阅专栏

文章目录

- Hive的DML语言

Hive的DML语言

1、数据导入

①向表中装载数据

语法：

load data [local] inpath '数据的path' [overwrite] into table table_name [partition (partcol1=val1,…)];

命令参数说明

参数	说明
Load data	加载数据
Local	表示从本地加载数据到hive表，否则是从HDFS加载数据到Hive表
Inpath	表是加载数据的路径
Overwrite	表示覆盖表中已有数据，否则表示追加
Into table	表示加载数据到哪张表中
Partition	表示加载数据到指定分区

1）创建一张表

create table student(
    id string,
    name string
)
row format delimited
fields terminated by '\t';

在这里插入图片描述

2）加载本地文件到hive

load data local inpath '/opt/module/hive/datas/student.txt' into table test.student;

在这里插入图片描述

3）查询数据是否load成功
在这里插入图片描述

②从hdfs加载到hive表中

（1）首先将文件上传到HDFS中

dfs -put /opt/module/hive/datas/student.txt /input;

（2）将HDFS文件加载到hive表中

load data inpath '/input/student.txt' into table test.student;

在这里插入图片描述

（3）覆盖数据

load data inpath '/input/student.txt' overwrite into table test.student;

在这里插入图片描述

注意：从hdfs上加载数据到hive表中，类似于拷贝的方式，所以在加载之后数据已经被拷贝走了，这个时候再次执行加载就会报错，需要重新上传数据到hdfs上

dfs -put /opt/module/hive/datas/student.txt /input;

load data inpath '/input/student.txt' overwrite into table test.student;

在这里插入图片描述

③通过查询向hive表中装载数据

insert overwrite table student2 select id, name from student ;

1）首先创建student2表

create table student2(
    id string,
    name string
)
row format delimited
fields terminated by '\t';

在这里插入图片描述

2）基本的插入数据

insert into table  student2 values(1,'wangwu'),(2,'zhaoliu');

在这里插入图片描述

3）根据查询结果插入数据

insert overwrite table student2 select id, name from student;

在这里插入图片描述

查看插入结果
在这里插入图片描述

insert into 和 insert overwrite的区别

Insert into：	以追加数据的方式插入到表或分区，原有数据不会删除
Insert overwrite：	会覆盖表中已存在的数据

insert不支持插入部分字段

4）多表插入模式

from student
insert overwrite table student2 
	select id, name 
insert overwrite table student3 
	select id, name;

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eJTKxy48-1640059477245)(C:\Users\lenovo\AppData\Roaming\Typora\typora-user-images\image-20211219191510853.png)]

④查询语句中创建表并加载数据（As Select）

在创建表的时候通过查询结果装载入表

create table if not exists student4
as select
	id, name
from student;

在这里插入图片描述

⑤创建表时通过Location指定加载数据路径

创建时指定表的存储位置

create external table if not exists student5(
    id int, name string
)
row format delimited fields terminated by '\t'
location '/input/student';

在这里插入图片描述

⑥Import数据到指定Hive表中

2、数据导出

①Insert导出

1）将查询的结果导出到本地

insert overwrite local directory '/opt/module/hive/datas/export/student'
select * from student;

在这里插入图片描述

查看导出的文件
在这里插入图片描述

2）上面这种情况导出的数据都挤在了一起，还可以格式化导出文件

insert overwrite local directory '/opt/module/hive/datas/export/student1'
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY '\t'             
select * from student;

在这里插入图片描述

查看文件
在这里插入图片描述

3）还可以将查询的结果导出到hdfs上，只需要去掉语句中的lcoal即可

insert overwrite directory '/output/student'
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY '\t' 
select * from student;

②Hadoop命令导出到本地

直接将hive存放在hdfs上的文件下载到本地即可

dfs -get /user/hive/warehouse/student/student.txt /opt/module/hive/datas/export/student3.txt;

③Hive Shell 命令导出

hive shell后面的参数加上e可以直接在命令窗口执行hql语句

bin/hive -e 'select * from test.student;' > /opt/module/hive/datas/export/student4.txt;

在这里插入图片描述

查看文件
在这里插入图片描述

④Export导出到HDFS上

export table test.student to '/user/hive/warehouse/export/student';

export和import主要用于两个Hadoop平台集群之间Hive表迁移

⑤sqoop导出

⑥DataX导出

3、清除表中的数据Truncate

注意：truncate只能清除管理表的数据，不可以清除外部表的数据

truncate table student4;

在这里插入图片描述

牧码文

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
03：Hive从0到1系列学习：DML数据操作语言

文章目录Hive得DML语言1、数据导入①向表中装载数据②从hdfs加载到hive表③通过查询项hive表中加载数据④查询语句中创建表并加载说句AS SELECT⑤创建表时通过location指定加载数据路径⑥import数据到指定表中2、数据导出①insert导出②hadoop命令导出本地③Hive shell命令导出④Export导出到hdfs上3、清除数据truncate1、数据导入①向表中装载数据②从hdfs加载到hive表中③通过查询向hive表中装载数据④查询语句中创建表并加载数据（As Sel
复制链接

扫一扫