1.以下关于Hive的说法,错误的是:( B )
A.Hive是一个构建于Hadoop顶层的数据仓库工具
B.Hive本身有文件系统,将数据存储在数据仓库之中
C.Hive依赖MapReduce计算模型处理数据
D.Hive定义了简单的类SQL 查询语言——HiveQL
2.以下关于Hive与Hadoop生态系统中其他组件的关系,错误的是:( C)
A.HiveQL语句编写的处理逻辑最终均要转化为MapReduce任务来运行
B.Pig可以对采集的原始数据进行处理,生成规范的数据以便使用Hive进一步分析处理
C.HBase一个面向列的、分布式的、可伸缩的数据库,它将查询处理转化为MapReduce程序进行执行
D.Hive一般用于处理大规模的静态数据,生成报表数据
3.以下关于Hive可以实现的功能的说法,正确的是:( C )
A.Hive支持批量数据导入,也支持单条数据插入
B.数据仓库中存放的是静态数据,支持对数据的更新操作
C.Hive的开发环境是基于集群的,所以具有较好的可扩展性
D.Hive是先进的大数据处理工具,处理数据时间延迟一般要比传统数据库要低
4.以下关于Hive HA的说法,错误的是( D )
A.HAProxy是一个管理多个Hive实例的工具
B.HAProxy提供一个接口,方便用户对Hive实例进行访问
C.HAProxy会将不可用的Hive实例放入黑名单
D.用户提交的给HAProxy的Hive查询,不需要对Hive实例进行逻辑性测试
5.以下关于Impala的系统架构说法,错误的是:( D )
A.Impalad是Impala的一个进程
B.State Store会创建一个statestored进程
C.CLI给用户提供查询使用的命令行工具
D.State Store负责协调客户端提交的查询的执行,给其他impalad分配任务以及收集其他impalad的执行结果进行汇总
6.以下关于Impala和Hive的说法,错误的是:( B )
A.Hive适合于长时间的批处理查询分析,而Impala适合于实时交互式SQL查询
B.Hive和Impala都依赖于MapReduce计算框架对查询进行处理
C.Hive在执行过程中,如果内存放不下所有数据,则会使用外存,以保证查询能顺序执行完成
D.Hive与Impala使用相同的元数据
7.Hive自带的元数据库不支持多用户操作A
A. 对
B. 错
8.Hive使用MySQL作元数据库之后,支持多用户操作。A
A. 对
B. 错
9.在一个Hadoop分布式集群中,需要在每一个集群节点都安装好Hive,Hive才能正常使用。B
A. 对
B. 错
10.在Hive中,必须要先创建数据库之后,才能再创建表。A
A. 对
B. 错