如何Load TXT 到HDInsight Hive table

本文介绍了如何通过HDInsight将TXT文件加载到Hive表中,包括上传TXT文件到HDI头节点,使用SSH访问,将文件复制到HDFS,创建Hive表结构,导入数据,并通过SQL查询进行操作。这种方法在处理TXT数据时灵活方便。
摘要由CSDN通过智能技术生成

如何Load TXT 到HDInsight Hive table

记得以前做过一个小项目,需要把客户整理的TXT导入到数据库,然后结合客户的需求统计分析特定条件的报表,比如表的schema为:time, name, meeting, level。需求统计特定的时间有多少人开过会等等。

迁移txt到数据库的方法有很多,比如:SSIS或者开发entity framework,读txt文件内容,然后写到数据库。这里我们介绍如何用HDInsight load txt到 HDI hive table,同样可以实现客户的需求。

上传hivetable.txt到HDI的headnode。

SSH到创建好的HDInsight headnode,查看文件内容。

sshuser@hn0-hdites:~$ cat hivetable.txt
linlin,123,male
brian,345,male
lin,567,female

复制txt文件到HDFS存储:

hdfs dfs -copyFromLocal hivetable.txt wasb://hditest-2019-10-06t08-00-38-459z@hditest.blob.core.windows.net/hive/

Note: hditest.blob.core.windows.net为Azure Blob存储数据库。

连接到Hive接口:

beeline -u 'jdbc:hive2://headnodehost:10001/;transportMode=http'

针对TXT文件,创建表结构如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值