Hadoop历险记（九 DML 数据操作）

vcaml7717

于 2023-05-05 23:10:47 发布

阅读量69

点赞数

分类专栏： Hadoop历险记文章标签： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43966468/article/details/130516048

版权

Hadoop历险记专栏收录该内容

10 篇文章 0 订阅

订阅专栏

加载数据

hive的数据加载操作很常见，工作中经常会遇到，你新建了一张hive表，然后数据文件在某某某个地方你把它导入到hive表对应的location下面。

比如上一篇中创建的那个表：它的路径是

/user/hive/warehouse/itheima.db/t_archer

然后有一个相同结构的数据文件 111.txt
你想往里面加数据只需用各种方式将将111.txt放到这个路径下
比如：

hadoop 命令：

hadoop fs -put 1.txt /user/hive/warehouse/itheima.db/t_archer

hdfs作为一个文件系统本身就有文件操作的功能所以它也可以用来加载hive数据。

hive主流的 load 语法
这应该是我们最常用的加载数据的方式

LOAD DATA [LOCAL] INPATH '/home/admin/test/test.txt' OVERWRITE INTO TABLE t_archer

这里注意这个可选的local。
如果不加local 那么代表这个路径是hdfs文件系统里面的路径。这个好理解。
如果加上local 那么就代表要加载一个本地文件过来，这个本地文件是哪里呢？
这里要注意这里的本地指的是： hiveserver2服务所在的那台linux机器。你的h2服务装在哪个机器上面就找哪个机器上面的路径。

这里新手千万不要搞混，比如你在A远程连接 B机器上的H2服务，这里的本地就是B机器而不是A机器。

insert+select 把查询的数据导入另一个hive表中
这里还有一个更灵活的用法就是把从一个A表中查询的数据加载到目标表B中。
（因为hive表映射的是hdfs文件所以它本质上其实还是把文件数据导入到表中）

insert into table A select * FROM B;

这里要注意一个习惯：你查询语句里的列的数目和排列顺序要和目标表的顺序和数目相同。

查询操作
具体的查询语句这个就很基础了如果有mysql 关系型数据库经验的新手可以很快速的上手这里就不多赘述了。如果是新手我推荐之间查现成的博客即可。
然后可以看一下这本书：Hive 编程指南

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。