目录
最后一次更新于 2020年11月15日 星期日 15:38:14
上传本地文件到hive
这里的本地指的是hdfs
语法:load data local inpath '本地文件路径' into table 表名;
load data local inpath '/opt/moudles/cdh/hive-1.2.1/input/student.txt' into table default.student;
hive中上传数据的三种方式
一.上传数据后修复
- 创建文件夹
hive (default)> dfs -mkdir -p /user/hive/warehouse/dept_partition2/month=20190928/day=03;
- /user/hive/warehouse是我创建好的hive的仓库
- 上传数据
hive (default)> dfs -put /opt/moudles/cdh/hive-0.13.1-cdh5.3.6/input/dept.txt /user/hive/warehouse/dept_partition2/month=20190928/day=03;
- 查询数据
hive (default)> select * from dept_partition2 where month=‘20190928’ and day=‘03’;
#查询不到数据
- 修复
hive (default)> msck repair table dept_partition2;
- 再次查询数据
hive (default)> select * from dept_partition2 where month=‘20190928’ and day=‘03’;
二.上传数据后添加分区
- 创建文件夹
hive (default)> dfs -mkdir -p /user/hive/warehouse/dept_partition2/month=20190928/day=03;
- /user/hive/warehouse是我创建好的hive的仓库
- 上传数据
hive (default)> dfs -put /opt/moudles/cdh/hive-0.13.1-cdh5.3.6/input/dept.txt /user/hive/warehouse/dept_partition2/month=20190928/day=04;
- 添加分区
hive (default)> alter table dept_partition2 add partition(month=‘20190928’,day=‘04’);
- 查询数据
hive (default)> select * from dept_partition2 where month=‘20190928’ and day=‘04’;
三.创建文件夹后load数据到分区
- 创建文件夹
hive (default)> dfs -mkdir -p /user/hive/warehouse/dept_partition2/month=20190928/day=05;
- /user/hive/warehouse是我创建好的hive的仓库
- 上传数据
hive (default)> load data local inpath ‘/opt/moudles/cdh/hive-0.13.1-cdh5.3.6/input/dept.txt’ into table dept_partition2 partition(month=‘20190928’,day=‘05’);
- 查询数据
hive (default)> select * from dept_partition2 where month=‘20190928’ and day=‘05’;