load data inpath的实践

最新推荐文章于 2024-01-12 09:13:29 发布

pc_cool

最新推荐文章于 2024-01-12 09:13:29 发布

阅读量4.5k

点赞数 1

分类专栏：数据开发文章标签： hive big data sql 大数据数据仓库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pc_cool/article/details/120550582

版权

数据开发专栏收录该内容

4 篇文章 0 订阅

订阅专栏

有个需求，需要在hive表里面追加数据，数据是历史数据，是业务方给的一个csv文件，

思路，考虑使用load data inpath，把历史数据导入到hive表里面

步骤：

1、利用已经搭建好的大数据平台，把csv文件上传到HDFS, 我是直接利用大数据平台提供的页面上传功能，
如果没有这个条件的，可以使用命令行：hadoop fs -put xxx.csv /export, 指定一个目录，目录名为export

2、创建一个表，表里面的字段名称和字段顺序，跟csv文件保持一致，例如这个表名叫 infor.load_data_test;

3、load data inpath 'hdfs://xxxxxx/user/hive/warehouse/export/xxx.csv' overwrite into table infor.load_data_test;
其中'hdfs://xxxxxx/user/hive/warehouse/export/xxx.csv'，是文件上传后，存放的位置

4、把临时表的数据写入到正式的hive表中

INSERT into infor.formal_data_table
select field1,field2, 1597456800000 as create_time from infor.load_data_test;

加一个时间戳，标识这批数据是什么时候写入的

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
load data inpath的实践

有个需求，需要在hive表里面追加数据，数据是历史数据，是业务方给的一个csv文件，思路，考虑使用load data inpath，把历史数据导入到hive表里面步骤：1、利用已经搭建好的大数据平台，把csv文件上传到HDFS, 我是直接利用大数据平台提供的页面上传功能，如果没有这个条件的，可以使用命令行：hadoop fs -put xxx.csv /export, 指定一个目录，目录名为export2、创建一个表，表里面的字段名称和字段顺序，跟csv文件保持一致，例如这个表名叫 inf
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。