什么是Hive?
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL)。
2.HIve的意义(最初研发的原因)
减少开发人员的开发成本和学习成本。
3.Hive的内部组成模块,作用分别是什么
元数据:描述数据的数据
内部执行流程:
解析器(解析SQL语句)、编译器(把SQL语句编译成MapReduce程序)、优化器(优化MapRedue程序)、执行器(将MapReduce程序运行的结果提交到HDFS)
4.Hive支持的数据格式
Text,SequenceFile,ParquetFile,ORC,RCFILE
5.进入Hiveshell窗口的方式?
第一种交互方式:Hive交互shell(直接通过bin/hive的方式)
第二种交互方式:Hive JDBC服务
1.启动hiveserver2服务
前台:bin/hive --service hiveserver2
2.beeline连接hiveserver2
beeline
beeline> !connect jdbc:hive2://node01:10000
6.Hive数据库、表在HDFS上存储的路径时什么?
/user/hive/warehouse
7、like与rlike的区别
like:like是模糊匹配查询
rlike:rlike支持正则表达式。
8.内部表与外部表的区别?
内部表删