Hive导入Excel数据应该先转化为linux系统能够读取的txt格式文件,然后导入到hdfs文件系统中,再从hdfs文件中 用load命令导入进hive
其次要注意,excel导出的CSV文件是以逗号分割形式呈现的,在hive建表的过程中需要指定逗号分割:
1.注意要将表头第一行(字段名)删除,然后先导出为csv,再查看数据格式,确认是UTF-8,再转为txt文件(个人习惯,CSV文件也可以,主要是确保不中文乱码,还有逗号分割)
注意,这里编码记得UTF-8,否则中文乱码格式不正确
2.上传文件到HDFS 里,先用rz 命令将文件上传到linux文件目录下,然后导入
hadoop fs -put /data/temp/ods_tj_farm_feed.txt /tmp
根据excel中的数据结构进行建表,注意结构顺寻要一致
3.load数据到hive表中
load data inpath '/tmp/ods_tj_farm_feed.txt' into table tianjin_ods.ods_tj_farm_feed;