HIve面试题(一)

本文涵盖了Hive的元数据存储方式及其特点,内部表与外部表的区别,HQL到MapReduce的转换过程,Hive的调优策略,权限控制,以及与关系数据库和HBase的对比。此外,还讨论了Hive的JOIN操作和sort by与order by的差异,是Hive学习者和面试者的宝贵资料。
摘要由CSDN通过智能技术生成

1. Hive 有哪些方式保存元数据,各有哪些特点。

  自身带的一个数据库derby
  也可以将原数据库设置为MYSQL

2. Hive内部表和外部表的区别

 1、在导入数据到外部表,数据并没有移动到自己的数据仓库目录下,也就是说外部表中的数据并不是由它自己来管理的,而是由!而内部表是由hive本身管理的;
 2、在删除表的时候,Hive将会把属于表的元数据和数据全部删掉;而删除外部表的时候,Hive仅仅删除外部表的元数据,数据是不会删除的!

3.hql是怎么转换成MapReduce的
在这里插入图片描述

4.hive如何调优

1.join优化,尽量将小表放在join的左边,如果一个表很小可以采用mapjoin;
2.排序优化,order by 一个reduce效率低,distirbute by +sort by 也可以实现全局排序;
3.使用分区,查询时可减少数据的检索,从而节省时间。
hive最终都会转化为mapreduce的job来运行,要想hive调优,实际上就是mapreduce调优,可以有下面几个方面的调优:解决收据倾斜问题,减少job数量,设置合理的map和reduce个数,对小文件进行合并,优化时把我整体,单个task最优不如整体最优
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值