![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
old_R
这个作者很懒,什么都没留下…
展开
-
hive中提高代码运行效率的参数配置及代码优化
今天整理下平时hive中用以提高代码运行效率的几个参数,和大家分享一下: 1、set mapreduce.map.memory.mb=5120; 此参数是设置每个map使用内存的大小,默认1024M,这个参数是控制map数量的关键参数。如果需要处理的文件较多或 较大时,则分开处理效率会较快,如果文件较少或较小时会造成map资源的浪费。 2、set mapreduce....原创 2019-09-14 22:22:27 · 900 阅读 · 0 评论 -
HIve面试题(一)
1. Hive 有哪些方式保存元数据,各有哪些特点。 自身带的一个数据库derby 也可以将原数据库设置为MYSQL 2. Hive内部表和外部表的区别 1、在导入数据到外部表,数据并没有移动到自己的数据仓库目录下,也就是说外部表中的数据并不是由它自己来管理的,而是由!而内部表是由hive本身管理的; 2、在删除表的时候,Hive将会把属于表的元数据和数据全部删掉;而删除外部表的时候...原创 2019-09-30 17:03:57 · 1521 阅读 · 0 评论