通过hive将excel文件,如何将hive表文本格式的源文件迁移至Oracle数据库或者excel文档中...

如何将hive表文本格式的源文件迁移至Oracle数据库或者excel文档中

需求描述:从hadoop的hdfs中下载某hive表文本文件,并将该文件数据迁移至Oracle表中。

思路剖析:首先,我们需要从hadoop服务器中下载该文本文件;其次,将该文件处理为excel规范表;最后,将规范的excel表结构插入值Oracle数据库对应的表中。话休絮烦,直接上demo。

1,从hadoop服务器的hdfs中下载源数据文本文件:

[html]view plaincopy

hadoop fs -get hdfs://nameservice/user/hive/house/r_map_region  /data/ailk/aiinsight/bin/xiepj

上述命令将hdfs中   nameservice/user/hive/house/r_map_region  路径下的源数据文本文件下载至 本地  /data/ailk/aiinsight/bin/xiepj 路径下

2,源数据加工

我们知道hive中表结构是保存在txt文件中,其中字段间的间隔符可以由用户指定。当我们拿到hdfs中的文本格式的源文件时,表结构往往不太清晰,不利于我们做一些加工处理,我们往往希望将其转换为excel表格的形式来对其处理。如下图所示:

7c10c6fbb56fca2d61bcaa3f5c02f6ef.png

将源数据中的分隔符替换为tab键:

b7c8e8bd6b125cd1d679d7626dd5bca8.png

3,替换后结果粘贴至excel表中,至此完成。

替换后文本效果:

94338001069d517eb55c15865bb9323d.png

excel格式效果;

53381376

f515eef4be7cb5799f5513433366d5a6.png

总结:excel中遇到tab键,数据会自动换至下一列。此处正式利用了excel的这一特性。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值