
1.入口 /bin/cli.sh
调用CliDriver类进行初始化过程
Ø 处理 -e, -f,-h等信息,如果是-h,打印提示信息,并退出
Ø 读取hive的配置文件,设置HiveConf
Ø 创建一个控制台,进入交互模式
2.在交互方式下,读取每一个输命令行,直到’;’为止,然后提交给processLine(cmd)方法处理,该方法将输入的流以;分割成多个命令 ,然后交给processCmd(cmd)方法 。
3.ProcessCmd(cmd) 对输入的命令行进行判断,根据命令的第一个记号(Token),分别进入相应的流程
Ø quit or exit 系统正常退出
Ø !开头的命令行,执行操作系统命令
Ø source 开头的,读取外部文件,并执行文件中的命令
Ø list 列出 jar file archive
其他命令提交给Commandprocess,进行命令的预处理
4.命令的预处理 CommandProcess
根据输入命令的第一个记号,分别进行处理
Ø set : 调用SetProcess类,设置hive的环境参数,并保存在该进程的HiveConf中
Ø dfs: 调用DfsProcess类,调用hadoop的shell接口,执行hadoop的相关命令
Ø add: 调用AddR

本文从入口点/bin/cli.sh开始,详细介绍了Hive的执行过程,包括交互模式初始化、命令处理、预处理、命令执行、获取执行结果及执行清理等步骤。在执行过程中,重点解析了Driver类的角色,它负责语句编译、生成执行计划并提交到Hadoop API执行。此外,还涉及到了HiveConf配置、命令如set、dfs、add、delete的处理,以及SQL语句转化为抽象语法树和逻辑、物理执行计划的过程。
最低0.47元/天 解锁文章
4万+

被折叠的 条评论
为什么被折叠?



