excel文件导入hive乱码_hive 从Excel中导入数据

本文介绍了如何处理Excel文件导入Hive时出现的乱码问题。首先删除Excel中的非数据内容,另存为UTF-8编码的txt文件,然后在Hive中创建与txt文件匹配的表结构,通过`LOAD DATA`命令将数据加载到Hive表中。确保数据正确导入的关键是文件编码和Hive表的字符集设置。同时,文章还提及了其他数据导入到数据库的方法,如Java POI库、Python和SQLLoader。
摘要由CSDN通过智能技术生成

拿到Excel表后将数据保留,其他的乱七八糟都删掉,然后另存为txt格式的文本,用nodepad++将文本转换为UTF-8编码,此处命名为cityprovince.txt

将cityprovince.txt传入操作的Linux环境中

hive建表,注意字段类型要相同

drop table tmp.cityprovince;

create table tmp.cityprovince (province String,city String,county String,station String)

row format delimited fields terminated by '\t' STORED AS TEXTFILE;

此处txt文本中以空格分开,所以此处以 '/t' 进行分割,否则会将整个数据全放在第一列中

4.在hive环境中执行指令

load data local inpath '/home/chengwu_1/cityprovince.txt' into table tmp.cityprovince;

5.在上一步显示ok后,可通过select * from tmp.cityprovince;进行验证。

注意:需要转换为utf-8,否则tmp.citryprovince会显示乱码

将字段相同的表合并可用union all实现:

select * from tableA union all select * from tableB

insert into tmp.applogresult select a.* from (select * from tmp.name1 union all select * from tmp.name2 u

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值