1,hive其实是在MapReduce上包了一层壳,hql语句最终还是翻译成MapReduce任务运行。
2,真实数据还是存放在hdfs上。
3,hive默认将元数据信息放到Derby数据库中,现实中我们喜欢放到mysql中。
如何理解元数据呢?可以理解成真实数据的路径,如上图所示如果找到了/user/hive/warehouse/park.db/stu也就找到了真实数据。而mysql就是来管理这些路径的,如下图所示当hive中配置了mysql之后mysql中会自动创建名为hive的数据库和如图的其他表,表中存放了找到这些数据的路径,还有数据组织方式。