欢迎大家扫码关注我的微信公众号:
一、数据导入
1.1 向表中加载数据(load): 用的很多
load data [local] inpath '/home/data/aaa.txt' [overwrite] into table student
[partition(partcol1=val1, partcol2=val2, ...)];
参数说明:
load data: 表示加载数据;
local: 表示从本地加载数据到 Hive 表, 否则表示从 HDFS 加载数据到 Hive 表;
inpath: 表示加载数据的路径;
overwrite: 表示覆盖表中的已有数据, 没有表示追加;
into table: 表示加载到哪张表;
student: 具体的表名;
partition: 表示上传到指定分区;
1.2 通过查询语句向表中插入数据(insert): 用的很多
1.2.1 基本模式插入: (根据单张表查询结果)
insert overwrite | into haha [partition(month='2019-03')] select id from aa;
可以将 select id from aa
的结果覆盖(插入)到 haha 表中;
1.2.2 多插入模式: (根据多张表查询结果) 用的不多
from student
insert overwrite table student partition(mont