HIve:创建hive表并通过HDFS文件进行导入数据(速度最快)
最近这个项目做hive建表在导入数据的时候,数据量大的时候难免会慢一点,现在又发现了一种新的导入数据方式;使用hdfs的文件进行导入,所以要使用的话就得先把文件上传到hdfs再操作三个前提:1.文件必须已经上传到hdfs,否则不行。2.这个表必须是不存在的,不能在已表上进行叠加数据;3.必须是目录级别,不能具体到文件;如果目录底下有多个文件,将会把所有文件数据都导入进去;如果正好需要将目录...
原创
2019-11-29 17:19:25 ·
6180 阅读 ·
0 评论