转载:https://blog.csdn.net/qq_26442553/article/details/80380590
转载:https://blog.csdn.net/weixin_43681796/article/details/106537339
https://blog.csdn.net/hao495430759/article/details/80529456
1、load data 导入数据到hive中
1.将本地数据文件导入到hive非分区表中,如下文件可以是个目录,会导入目录中所有的文件
load data local inpath '/home/robot/'
overwrite into table fdm_sor.personinfo
2.将本地数据文件导入到hive分区表中
load data local inpath '/home/robot/'
overwrite into table fdm_sor.personinfo
partition(country='china',city='nanjing')
注意文件格式需要跟建表时指定的一致
3、如果文件是在hdfs里的,去掉local即可
注意:
1.inpath里只要填目录即可,不用具体到文件,会加载目录下所有问题,但该目录下不能再有子目录,否则报错。
2.overwrite 可以不加,加的话会将表中所有数据覆盖掉(分区表只覆盖当前分区数据),into talbe 将数据追加到表中。
3.into talbe 如果表里数据已经存在了,会再次到导入,底层文件存储会给同文件名加