hive的执行过程,大体上是这样的:
- hive 客户端(一般是hive cli,入口类为CliDriver)把HQL翻译成MR执行计划(Operator树)并序列化到 plan.xml
- plan.xml 上传到hdfs上
- hive 客户端新起一进程,提交MapReduce程序,其入口类为ExecDriver,ExecDriver的Mapper会在setup阶段读取plan.xml,反序列化成Operator树结构,然后执行。
hive的执行过程,大体上是这样的:
转载于:https://juejin.im/post/5c19078af265da61776be85a