hive操作时,
如果使用insert+values进行数据插入,会非常慢 可以插入数据 但是效率不高。
原因:底层hive会把插入语句编译成MapReduce程序来执行!
为什么用load?
-
含义:加载装载数据 也是hive推荐的插入表数据的方式。
-
本质:加载操作是将结构化的数据文件移动到与 Hive表对应的位置(位于hdfs上)的纯复制/移动操作。
-
注意:在加载的过程中 hive不会对数据进行任何修改 只是搬运移动复制的过程。(cp mv)
hive操作时,
如果使用insert+values进行数据插入,会非常慢 可以插入数据 但是效率不高。
原因:底层hive会把插入语句编译成MapReduce程序来执行!
为什么用load?
含义:加载装载数据 也是hive推荐的插入表数据的方式。
本质:加载操作是将结构化的数据文件移动到与 Hive表对应的位置(位于hdfs上)的纯复制/移动操作。
注意:在加载的过程中 hive不会对数据进行任何修改 只是搬运移动复制的过程。(cp mv)