hive 导入数据的5种方式


1. 向表中装载数据(Load)

load data [local] inpath '路径' [overwrite] into table 表名 [partition (分区字段=值,…)];

overwrite:表示覆盖表中已有数据,否则表示追加

如:

  从本地文件系统加载数据到hive表

load data local inpath '/home/hdfs/data/test.txt' into table test;

在这里插入图片描述
  从hdfs文件系统加载数据覆盖hive表

hive (default)> dfs -put /home/hdfs/data/test.txt /wcinput;
hive (default)> load data inpath '/wcinput/test.txt' overwrite into table test;

在这里插入图片描述


2. 通过查询语句向表中插入数据

insert into:以追加数据的方式插入到表或分区,原有数据不会删除

 INSERT INTO TABLE tablename1 [PARTITION(partcol1=val1, partcol2=val2 ...)]  select_statement1 FROM from_statement;

insert overwrite:覆盖表中已存在的数据

INSERT OVERWRITE TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...) ]  select_statement1 FROM from_statement;

3. 创建表时加载数据

(1)创建表时使用查询语句as select

create table if not exists 表名 as select_statement1 FROM from_statement;

(2)创建表时通过location指定加载数据路径


4. Import数据到指定Hive表中

先用export导出后,再将数据导入(export和import主要用于两个Hadoop平台集群之间Hive表迁移)

import table 表名 from '路径';

如:
从a集群中导出hive表数据:

export table default.student to '/wcinput/export';

在这里插入图片描述

向b集群中导入数据到hive表:

import table student from '/wcinput/export' ;

在这里插入图片描述


5. sqoop导入数据

Sqoop User Guide


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

但行益事莫问前程

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值