一、数据文件的准备
1.需要导入的EXCEL文件,去掉表头
2.把EXCEL文件另存为txt文件
3.把txt文件转的编码换成UTF-8-BOM,否则中文会乱码
4.txt文件导入到hive相关的服务器上,比如上传到路径:/tmp/file/
二、hive库建表
使用DBeaver客户端建表,也可以在服务器执行建表语句。
DDL建表语句的格式需为以下:
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'LINES TERMINATED BY '\n'
以上格式是使用分隔符区分txt文档的每一列的数据
建表语句参考:
CREATE TABLE schema.table_name(
column string COMMENT'字段名')
COMMENT '表名'
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'LINES TERMINATED BY '\n'
三、数据文件的导入操作
1.在服务器上执行
1-1.使用Xshell访问
登录到hive,命令参考:
beeline -u 'jdbc:hive2://10.168.168.168:18420' -n hive -p password;
PS:ip地址为hive所在的服务器,端口是18420,-n是hive数据库的用户名,-p是密码
1-2.执行导入命令,命令参考:
load data local inpath'/tmp/file/filename.txt' into table schema.table_name;
PS:inpath里的为服务器里的数据文件的绝对路径
2.直接在DBeaver客户端执行(需有相关执行权限的用户才行)
load data local inpath'/tmp/file/filename.txt' into table schema.table_name;
以上就是将文本数据导入hive的操作了。