《大数据库》题库

星河欲转。

已于 2023-11-20 18:00:26 修改

阅读量1k

点赞数

分类专栏： python 文章标签：大数据 hadoop

于 2022-11-22 09:31:39 首次发布

本文链接：https://blog.csdn.net/m0_51863774/article/details/127976389

版权

python 专栏收录该内容

35 篇文章 0 订阅

订阅专栏

大数据库练习题目集-概述
判断题
1.   根据IDC作出的估测，数据每两年增长一倍。T
2.   根据IDC作出的估测，数据一直都在以每年50%的速度增长。T
3.   大数据是一种价值密度低，而商业价值高的数据集合。T
4.   大数据是由结构化、半结构化数据和非结构化数据组成的。T
5.   大数据是一种价值密度高，商业价值也高的数据集合。F
6.   大数据是一种价值密度低，商业价值也低的数据集合。F
7.   大数据是一种价值密度高，而商业价值低的数据集合。F
8.   Hadoop汇集了结构化和非结构化的数据。T
9.   Hadoop是一个大规模串行处理框架，拥有超级计算能力。F
10.   CAP原则是在一个分布式系统中，一致性、可用性、分区容错性，三者不可得兼。T
11.   BASE理论是对CAP理论的延伸，核心思想是即使无法做到强一致性，但应用可以采用适合的方式达到最终一致性。T
单选题

1.   IBM提出的大数据的5V特点包括： ( ) 、高速、低价值密度、真实性。
大量、多样
2.   大数据是由结构化数据、半结构化数据和 ( )数据组成的。非结构化
3. Hadoop是一个数据管理系统，作为( ) 的核心，汇集了结构化和非结构化的数据。数据分析
4. Hadoop是一个大规模( )，拥有超级计算能力。并行处理框架
填空题
1.   大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合，具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
2.   IBM提出的大数据的5V特点包括：大量、高速、多样、价值密度低、真实性。
3.   大数据摩尔定律：根据IDC作出的估测，数据一直都在以每年50%的速度增长。
4.   大数据摩尔定律：根据IDC作出的估测，数据每两年增长一倍。
5.   大数据是由结构化数据、半结构化数据和非结构化数据组成的。
6.   Hadoop是一个数据管理系统，作为数据分析的核心，汇集了结构化和非结构化的数据。
7.   Hadoop是一个大规模并行处理框架，拥有超级计算能力。

大数据库练习题目集-Hive
判断题
1.   Hive的存储位置可在建表时自由指定在HDFS之上的合适位置。T
2.   Hive有专门的数据存储格式。F
3.   Hive本身没有专门的数据存储格式，它基本支持HDFS支持的所有文本格式。T
4.   Hadoop集群通常由一个NameNode和多个DataNode组成。T
5.   Hadoop集群中 ResourceManager工作在主节点上，负责对多个NodeManager的资源实行统一管理和调度。T
6.   Hadoop集群中NodeManager工作在从节点上，相当于所在机器的代理，负责本机程序运行、资源管理和监控。T
7.   Hive数据以多副本的主从模式进行存储，保障了数据的可用性。T
8.   Hive数据以单机模式进行存储。F
9.   Hive建表时，可以由用户指定表的字段间间隔符、换行符以及存储位置等。T
10.   Hive的分区技术可以避免Hive全表扫描，提升查询效率。T
11.   Hive中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。T
12.   Hive分区使用的是表外字段，Hive分桶使用的是表内字段。T
13.   Hive分区使用的是表外字段，Hive分桶使用的是表外字段。F
14.   Hive分区使用的是表内字段，Hive分桶使用的是表内字段。F
15.   Hive分区使用的是表内字段，Hive分桶使用的是表外字段。F
16.   Hive分区数量是固定的，Hive分桶数量是固定的。F
17.   Hive分区数量是固定的，Hive分桶数量不是固定的。F
18.   Hive分区数量不是固定的，Hive分桶数量是固定的。T
19.   Hive分区数量不是固定的，Hive分桶数量不是固定的。F
20.   Hive分区可以再分区，Hive分桶可以再分桶。F
21.   Hive分区可以再分区，Hive分桶不可以再分桶。T
22.   Hive分区不可以再分区，Hive分桶可以再分桶。F
23.   Hive分区不可以再分区，Hive分桶不可以再分桶。F
24.   Hive 中 SORT BY是对每个Reducer内部进行排序，对全局结果集来说不是排序。T
25.   Hive 中 SORT BY是对全局结果集进行排序。F
26.   Hive 中 SORT BY是对每个Reducer内部进行排序，对全局结果集来说也是排序的。F
27.   Hive 中 ORDER BY能保证输出中的总顺序。T
28.   Hive 中SORT BY 控制Reducer内的数据进行排序。T
29.   使用Hive的DISTRIBUTE BY 子句可以控制某个特定行被分配到指定Reducer。T
30.   Hive 中，当DISTRIBUTE BY和SORT BY字段相同且排序规则为升序时，可以使用CLUSTER BY方式代替。T
31.   Hive 中，当DISTRIBUTE BY和SORT BY字段相同且排序规则为降序时，可以使用CLUSTER BY方式代替。F
32.   Hive 中，使用CLUSTER BY方式进行字段排序时可以指定排序规则。F
33.   Hive 中，使用CLUSTER BY方式进行字段排序时可以指定降序。F
单选题
1.   ( )是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在( )中的大规模数据的机制。Hive, Hadoop
2.   Hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成( )任务来执行。MapReduce
3.   数据表文件的元数据保存在HDFS的( )中，实际数据则存储在 ( )中。NameNode, DataNode
4.   Hive中通常使用( )分隔字段（列），在CREATE TABLE语句中，可以使用八进制编码\001表示。^A(CTRL+A)
5.   Hive中通常使用( )用于分隔ARRARY或者STRUCT中的元素，或用于MAP中键-值对之间的分隔，在CREATE TABLE语句中，可以使用八进制编码\002表示。^B(CTRL+B)
6.   Hive中通常使用 ( )用于MAP中键和值之间的分隔，在CREATE TABLE语句中，可以使用八进制编码\003表示。^C(CTRL+C)
7.   以下正确的是：（）。select *from dept_partition distribute by deptno sort by deptno与 select *from dept_partition cluster by deptno 等价
填空题
1.   数据仓库是支持管理决策过程的、面向主题的、集合的、随时间而变的、持久化的数据集合。
2.   事实表是数据仓库的核心，将各种不同的维表连接起来，每条元组都含有指向各个维表的键和一些相应的测量数据。
3.   Hive应用的数据存储在HDFS上，HDFS将大文件切分成等大小的数据块以多副本的形式分布在服务器集群中。
4.   Hive的元数据包含Hive自身应用的信息和创建的数据库、表等的元信息。
5.   Hadoop集群通常由一个NameNode和多个DataNode组成。其中NameNode是集群中的管理者，DataNode是HDFS的工作节点，存储实际的数据。
6.   Hive支持的数据类型可分为基本数据类型和复杂数据类型两种。
7.   Hive中的表分为内部表(MANAGED_TABLE)和外部表(EXTERNAL_TABLE)，内部表DROP时会删除HDFS上的数据; 外部表DROP时不会删除HDFS上的数据。
8.   Hive使用分区技术，避免Hive全表扫描，提升查询效率。
9.   Hive的分区表在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区，这样的查询效率会提高很多。
10.   Hive 中 ORDER BY 会对查询结果进行一个全局排序，当开启MR 严格模式的时候ORDER BY 必须要设置LIMIT子句。
11.   Hive 中，当DISTRIBUTE BY和SORT BY字段相同且排序规则为升序时，可以使用CLUSTER BY方式代替。
主观题
1.   程序题
建立一个用户表userinfo，字段信息如下表，字段间使用CTRL+A间隔，数组元素或结构元素或映射键-值对间使用CTRL+B间隔，映射键与值之间使用CTRL+C间隔，数据行间使用回车间隔，文件格式为文本文件。

CREATE TABLE userinfo ( Uname STRING, Salary FLOAT,
FamilyMembers ARRAY, Deductions MAP<STRING,FLOAT>,
Address STRUCTprovince:String,city:STRING,zip:INT )
ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\001’
COLLECTION ITEMS TERMINATED BY ‘\002’
MAP KEYS TERMINATED BY ‘\003’ LINES
TERMINATED BY ‘\n’ STORED AS TEXTFILE;
2-18题未做
大数据库练习题目集-键值数据库
判断题
1.   键值数据库非常适合通过键对数据进行查询和修改等操作。T
2.   键值数据库具有极高的并发读写性能。T
3.   redis 的 string 可以包含任何数据，比如jpg图片或者序列化的对象。T
4.   Redis列表是通过链接列表实现的简单的字符串列表，按照插入顺序排序。T
5.   Redis列表越靠近头和尾的元素操作越快，越靠近中间则越慢。T
6.   Redis列表越靠近头的元素操作越快，越靠近尾的元素操作越慢。F
7.   Redis列表越靠近尾的元素操作越快，越靠近头的元素操作越慢。F
8.   Redis列表是一个有序集合。T
9.   在redis数据库中，如果在列表头部和尾部插入数据，性能会非常高，不受链表长度的影响。T
10.   在redis数据库中，如果在列表头部和尾部插入数据，性能会受到链表长度的影响。F
11.   Redis 的HASH类型中，key 对应的 value 是一个二维数组。T
12.   redis的Set是一个有序string类型集合。F
13.   redis的set 集合不允许数据重复，如果添加的数据在 set 中已经存在，将只保留一份。T
14.   redis的set 类型提供了多个 set 之间的聚合运算，如求交集、并集、补集，这些操作在 redis 内部完成，效率很高。T
15.   redis的ZSet是一个string类型集合，且不允许重复的元素。T
16.   redis的ZSet中，每个元素都会关联一个双精度类型的分数。redis通过集合中的分数来为集合中的元素进行从小到大的排序。T
17.   redis的ZSet是有序的，每个元素是唯一的。T
18.   redis的ZSet是有序的，集合元素是可以重复的。F
19.   redis的有序集合是使用散列表和跳跃表实现的。所以和列表相比，操作中间元素的速度也很快。T
20.   Redis 数据类型中的有序集合类型比 Redis 数据类型中的列表类型更加耗费资源。T
21.   数据的复制是单向的，只能由从节点到主节点。F
22.   数据的复制是单向的，只能由主节点到从节点。T
23.   数据的复制是双向的，可能由主节点到从节点。F
24.   在redis中，一个主节点可以有多个从节点(或没有从节点)，但一个从节点只能有一个主节点。T
25.   在redis中，一个主节点可以有多个从节点(或没有从节点)，一个从节点也可以有多个主节点。F
单选题
1.   在redis数据库中，要修改某键的值，可使用（）命令。SET
2.   在redis数据库中，要新键一个键并赋值，可使用（）命令。SET
3.   在redis数据库中，要删除一个键及其值，可使用（）命令。DEL
4.   在redis数据库中，要获取某键的值，可以使用（）命令。GET
5.   在redis中，向列表头部添加元素的命令是（）。LPUSH
6.   在redis中，向列表尾部添加元素的命令是（）。RPUSH
7.   在redis中，向列表中部添加元素的命令是（）。LINSERT
8.   在redis中，从列表头部弹出元素的命令是（）。LPOP
9.   在redis中，从列表尾部弹出元素的命令是（）。RPOP
10.   在redis中，从列表删除指定值的命令是（）。LREM
11.   在redis中，获取列表中元素个数的命令是（）。LLEN
12.   在redis中，获取列表的子列表的命令是（）。LRANGE
13.   在redis中，获取列表中指定索引的值的命令是 ____ 。LINDEX
14.   在redis中，修改列表中指定索引的值的命令是 ____ 。LSET
15.   在redis中，修改hash键的字段值的命令是 ____ 。HSET
16.   在redis中，同时为hash键的多个字段赋值的命令是 ____ 。HMSET
17.   在redis中，删除hash键的字段的命令是 ____ 。HDEL
18.   在redis中，获取hash键的一个字段的值的命令是 ____ 。HGET
19.   在redis中，获取hash键的多字段的值的命令是 ____ 。HMGET
20.   在redis中，获取hash键的所有字段和所有值的命令是 ____ 。HGETALL
21.   在redis中，检查hash键的某字段是否存在的命令是 ____ 。HEXISTS
22.   在redis中，获取hash键的所有字段名的命令是 ____ 。HKEYS
23.   在redis中，获取hash键的所有字段值的命令是 ____ 。HVALS
24.   在redis中，获取hash键的字段数量的命令是 ____ 。HLEN
25.   在redis中，增加集合键的元素的命令是 ____ 。SADD
26.   在redis中，删除集合键的元素的命令是 ____ 。SREM
27.   在redis中，获取指定集合的所有元素的命令是 ____ 。SMEMBERS
28.   在redis中，判断给定集合中某个元素是否存在的命令是 ____ 。SISMEMBER
29.   在redis中，获取集合中元素个数的命令是 ____ 。SCARD
30.   在redis数据库中，增加有序集合元素的命令是（）。ZADD
31.   在redis数据库中，删除有序集合的元素的命令是（）。ZREM
32.   在redis数据库中，根据排名范围删除有序集合的元素的命令是（）。ZREMRANGEBYRANK
33.   在redis数据库中，按照分数范围删除有序集合的元素的命令是（）。ZREMRANGEBYSCORE
34.   在redis数据库中，获取有序集合的元素分数的命令是（）。ZSCORE
35.   在redis数据库中，获取排名在某个范围内的有序集合元素列表的命令是（）。ZRANGE
36.   在redis数据库中，获取指定分数范围的有序集合元素的命令是（）。ZRANGEBYSCORE
37.   在redis数据库中，获取有序集合中元素的数量的命令是（）。ZCARD
38.   在redis数据库中，获取有序集合中指定分数范围内的元素个数的命令是（）。ZCOUNT
39.   在redis数据库中，获取有序集合中元素的倒序排名的命令是（）。ZREVRANK
填空题
1.   Redis列表是通过链接列表实现的简单的字符串列表，按照插入顺序排序
2.   在社交类应用——微信中，要获取共同好友列表，可以使用redis数据库的集合类型的交集的运算。
3.   redis数据库中的ZSet和Set一样是字符串类型元素的集合，且不允许重复的元素。
4.   在redis的有序集合中，每个元素都会关联一个双精度类型的分数。redis是通过分数来为集合中的元素进行从小到大的排序。
5.   redis的ZSet的元素是唯一的，但分数（score）却可以重复。
6.   从集合元素的有序性及元素重复性方面来看，redis 的集合类型是无序的，每个元素是唯一的。redis 的有序集合是有序的，每个元素是唯一的。
7.   redis 的有序集合是使用散列表和跳跃表实现的。所以和列表相比，操作中间元素的速度也很快。
8.   Redis持久化分为 RDB 持久化和 AOF 持久化。
9.   在 redis 持久化中， RDB 将当前数据保存到硬盘， AOF 是将每次执行的写命令保存到硬盘。
10.   redis 事务可以一次执行多个命令，会经历三个阶段：开始事务，命令入队，执行事务。
11.   Redis 的主从复制是指将一台Redis 服务器的数据，复制到其他的 Redis 服务器。前者称为主节点，后者称为从节点。
12.   redis 数据的复制是单向的，只能由主节点到从节点。
主观题
1.   在redis数据库中，设定名为mykey的key，对应value为value1。请写出对应的语句。set mykey value1
2.   在redis数据库中，检查给定名为mykey的key是否存在。请写出语句。exists mykey
3.   在redis数据库中，删除名为testkey的键及对应的值。请写出语句。del testkey
4.   在redis数据库中，修改mykey的名称为newkey。请写出语句。rename mykey newkey
5.   在redis数据库中，向test:key键的尾部追加值456，请写出语句。append test 456
6.   在redis数据库中，欲同时将title键赋值为redis、desc键赋值为键值数据库，请写出语句。mset title redis desc "键值数据库"
7.   在redis数据库中，欲同时获取title键与desc键的值，请写出语句。mget title desc
8.   在redis数据库中，向列表键listkey1头部插入123、abc两个元素，请写出相应的语句。lpush listkey1 "123" "abc"
9.   在redis数据库中，向列表键listkey1尾部插入123、abc两个元素，请写出相应的语句。rpush listkey1 "123" "abc"
10.   在redis数据库中，要向列表键listkey1的值listvalue4之前插入元素‘mongodb’，请写出相应语句。linsert listkey1 before "listvalue4" "mongodb"
11.   在redis数据库中，要向列表键listkey1的值listvalue4之后插入元素‘mongodb’，请写出相应语句。linsert listkey1 after "listvalue4" "mongodb
12.   在redis数据库中，从列表键listkey1头部弹出元素abc，请写出相应的语句。lpop listkey1
13.   在redis数据库中，从列表键listkey1尾部弹出元素abc，请写出相应的语句。rpop listkey1
14.   在redis数据库中，要从列表键listkey1中删除值mongodb，请写出相应语句。lrem listkey1 1 "mongodb"
15.   在redis数据库中，删除列表键listkey1的内容，要求保留列表键listkey1中从startval到endval之间的值，请写出相应语句。ltrim listkey1 startval endval
16.   在redis数据库中，请使用语句查询列表键listkey1的元素个数。llen listkey1
17.   在redis数据库中，请使用语句获取列表键listkey1的从第3个元素到第10个元素之间的子列表。lrange listkey1 3 10
18.   在redis数据库中，请使用语句获取列表键listkey1的第6个元素。lindex listkey1 6
19.   在redis数据库中，请使用语句修改列表键listkey1的第6个元素的值为mongodb。lset listkey1 6 "mongodb"
20.   在redis数据库中，请使用语句为hash键hashkey1的字段field1赋值为mongodb。hset hashkey1 field1 "mongodb"
21.   在redis数据库中，请使用语句为hash键hashkey1的字段field1和field2分别赋值为mongodb与hbase。hmset hashkey1 field1 "mongodb" field2 "hbase"
22.   在redis数据库中，请使用语句删除hash键hashkey1的字段field1和field2。hdel hashkey1 field1 field2
23.   在redis数据库中，请使用语句获取hash键hashkey1的字段field1的值。hget hashkey1 field1
24.   在redis数据库中，请使用语句获取hash键hashkey1的字段field1与field2的值。hmget hashkey1 field1 field2
25.   在redis数据库中，请使用语句获取hash键hashkey1的所有字段和所有值。hgetall hashkey1
26.   在redis数据库中，请使用语句检查hash键hashkey1有没有字段field2。hexists hashkey1 field2
27.   在redis数据库中，请使用语句获取hash键hashkey1的所有字段名。hkeys hashkey1
28.   在redis数据库中，请使用语句获取hash键hashkey1的所有字段值。hvals hashkey1
29.   在redis数据库中，请使用语句获取hash键hashkey1的字段数量。HLEN hashkey1
30.   在redis数据库中，请使用语句增加集合键setkey1的元素setval1。SADD setkey1 "setval1"
31.   在redis数据库中，请使用语句删除集合键setkey1的元素setval1。SREM setkey1 "setval1"
32.   在redis数据库中，请使用语句获取集合键setkey1的所有元素。SMEMBERS setkey1
33.   在redis数据库中，请使用语句检查集合键setkey1中有没有元素setval1。
SISMEMBER setkey1 setval1
34.   在redis数据库中，请使用语句获取集合键setkey1的元素个数。
SCARD setkey1
35.   在redis数据库中，增加有序集合键zsetkey1的元素zsetval1与zsetval2，其分数分别为sorce1与sorce2，请写出相应语句。ZADD zsetkey1 sorce1 zsetval1 sorce2 zsetval2
36.   在redis数据库中，请写出语句删除ZSet键zsetkey1的元素zsetval1与zsetval2。ZREM zsetkey1 zsetval1 zsetval2
37.   在redis数据库中，请写出语句删除ZSet键zsetkey1的排名在2到5之间的元素。ZREMRANGEBYRANK zsetkey1 1 4
38.   在redis数据库中，请写出语句删除ZSet键zsetkey1的分数在20到50之间的元素。ZREMRANGEBYSCORE zsetkey1 20 50
39.   在redis数据库中，请写出语句获取ZSet键zsetkey1的值为 zsetvalue 的元素的分数。ZSCORE zsetkey1 zsetvalue
40.   在redis数据库中，请写出语句获取ZSet键zsetkey1的排名在2到5的元素列表。ZRANGE zsetkey1 1 4
41.   在redis数据库中，请写出语句获取ZSet键zsetkey1的分数在20到50之间的元素列表。ZRANGEBYSCORE zsetkey1 20 50
42.   在redis数据库中，请写出语句获取ZSet键zsetkey1的元素的数量。ZCARD zsetkey1
43.   在redis数据库中，请写出语句获取ZSet键zsetkey1的分数在20到50之间的元素数量。ZCOUNT zsetkey1 20 50
44.   在redis数据库中，请写出语句获取ZSet键zsetkey1的元素mongodb的倒序排名。ZREVRANK zsetkey1 mongodb
大数据库练习题目集-列族数据库Hbase应用
判断题
1. HBase是一种构建在HDFS之上的分布式、面向列的存储系统。T
2. HBase不是关系型数据库，也不支持SQL。T
3. HBase是关系型数据库，但不支持SQL。F
4. HBase的数据是用表来组织的，表由行和列组成，列分为若干个列族。T
5.HBase的数据是用表来组织的，表由行和列组成，列分为若干个列族。T
6. HBase列族里的数据通过列限定符（或列）来定位。T
7. HBase每个单元格都保存着同一份数据的多个版本，这些版本采用时间戳进行索引。T
8. 在HBase中创建一个表的时候，列族必须作为模式定义的一部分预先给出，而列族成员可以随后按需加入。T
9. 在HBase中创建一个表的时候，列族与列族成员必须作为模式定义的一部分预先给出。F
10. 在HBase中创建一个表的时候，列族与列族成员都支持动态扩展的，都可以随后按需加入。F
11. 一个HBase表中会有若干个行键，且行键的值不能重复。T
12. HBase行键按字典顺序排列，最低的顺序首先出现在表格中。T
13. HBase自动把表水平划分为区域，每个区域都是有若干连续行构成的，一个区域由所属的表、起始行、终止行（不包括这行）三个要素来表示。T
14. HBase集群中的每个节点（Region Server）管理整个表的一个区域。F
15. HBase集群中的每个节点（Region Server）管理整个表的若干个区域。T
16. 当一张表的行太多的时候，HBase 就会根据行键的值对表中的行进行分区。T
17. HBase中，不同的 Region 可以分布在不同的 Region Server 上，但一个 Region 不会拆分到多个 Region Server 上。T
18. HBase中，不同的 Region 可以分布在不同的 Region Server 上，同一个 Region 也可以拆分到多个 Region Server 上。F
19.HBase中，不同的 Region 可以放在同一个 Region Server 上，但一个 Region 不会拆分到多个 Region Server 上。F
20. HBase中，不同的 Region 可以放在同一个 Region Server 上，一个 Region 也可拆分到多个 Region Server 上。F
21. HBase Client使用HBase的RPC机制与HMaster和HRegionServer进行通信，对于管理类操作，Client与HMaster进行RPC；对于数据读写类操作，Client与HRegionServer进行RPC。T
22. Zookeeper保证任何时候，HBase集群中只有一个master。T
23. HMaster是主服务器的实现，主服务器负责监视集群中所有的RegionServer实例，并且是所有元数据更改的接口。T
24. Hmaster为Region server分配region。T
25. HBase为每个列族建一个HStore ，如果有几个列族，也就有几个HStore。T
26. HBase区域服务器RegionServer负责存储和维护分配给自己的Region，响应客户端的读写请求。T
27. HBase行中没有保存数据的列或单元格不占用存储空间，一张表中列族对应的列可随着插入数据的业务变化而变化，每行列可以有差别。T
28. 每行都有一个可排序的主键和任意多的列，列可以根据需要动态的增加，同一张表中不同的行可以有截然不同的列。T
29. HBase中的数据都是字符串，没有类型。T
30. HBase每个单元格中的数据可以有多个版本。T
31. HBase需要先禁用表才能删除表。T
32. HBase启用的表是可以删除的。F

单选题
1.   Hbase是一个高可靠性、高性能、 ( ) 可伸缩的分布式存储系统面向列
2.   HBase利用 ( )作为其文件存储系统。HDFS
3.   HBase利用( )来处理HBase中的海量数据。Hadoop MapReduce
4.   HBase利用( )作为协同服务。Zookeeper
5.   一个HBase表被分组成许多( )的集合，它是基本的访问控制单元。列族
6.   ( )是HBase集群上分布数据的最小单位。区域
7.   当一张表的行太多的时候，HBase 就会根据（）的值对表中的行进行分区。行键
8.   每个 Region 由（） Store 组成，每个 Store 保存一个（）的数据。一个或者多个，列族
9.   HBase的每个 Store 又由（）个 memStore 和（）个 Store File 组成。Store File 以 HFile 格式保存在 HDFS 上。一，0 至多
10.   HBase创建表的命令是（）。create
11.   HBase修改列族的命令是（）。alter
12.   HBase删除表的命令是（）。Drop
13.   HBase添加表的数据的命令是（）。Put
14.   HBase通过扫描表来获取有用的值，可使用命令（）。Scan
15.   HBase中获取行的值的命令（）。get
16.   HBase统计表中行的数量的命令是（）。Count
17.   HBase删除表中指定对象的值的命令（）。delete
18.   HBase删除指定行的所有元素值的命令是（）。Deleteall
19.   HBase中获取行键所在的区域的命令是（）。locate_region
填空题
1.   HBase的每个表由若干行组成，每行有一个行键作为这一行的唯一标识。
2.   一个HBase表被分组成许多列族的集合，它是基本的访问控制单元。
3.   HBase每个单元格都保存着同一份数据的多个版本，这些版本采用时间戳进行索引。
4.   HBase行键按字典顺序排列，最低的顺序首先出现在表格中。
5.   HBase中需要根据行键、列族、列限定符和时间戳来确定一个单元格，因此，可以视为是一个四维坐标。
6.   区域是HBase集群上分布数据的最小单位。
7.   当一张表的行太多的时候，HBase 就会根据行键的值对表中的行进行分区。
8.   HBase中的Region 是按大小分割的，每个表一开始只有一个 Region，随着数据不断插入到表中，Region 不断增大，当增大到一个阈值的时候，Region 就会等分为两个新的 Region。
主观题
1.   创建一个HBase的表tbl_user，包含两个列族info和detail，请写出语句。create 'tbl_user', 'info', 'detail'
2.   在HBase的表tbl_user中添加一个列族address，请写出语句。alter 'tbl_user', 'address'
3.   请使用语句删除HBase表tbl_user中的列族address。alter 'tbl_user', {NAME=> 'address', METHOD=> 'delete'}
4.   请使用语句判断HBase的表tbl_user是否存在。exists 'tbl_user'
5.   请写出HBase启用表tbl_user的语句。enable 'tbl_user'
6.   请写出HBase禁用表tbl_user的语句。disable 'tbl_user’
7.   请写出HBase的判断表tbl_user是否启用的语句。is_enabled 'tbl_user'
8.   请写出HBase判断表tbl_user是否禁用的语句。is_disabled 'tbl_user’
9.   请写出HBase删除表tbl_user的语句。disable 'tbl_user’ drop 'tbl_user’
10.   请写出HBase获取表tbl_user的行键rk1所在的区域的语句。locate_region 'tbl_user', 'rk1'
11.   要扫描HBase的表tbl_user的列族info，请写出语句。scan 'tbl_user', {COLUMN=>'info'}
12.   要扫描HBase的表tbl_user的列族info中的age列，请写出语句。scan 'tbl_user', {COLUMN=>'info:age'}
13.   请编写HBase语句获取表tbl_user的行键rk1的数据。get 'tbl_user', 'rk1'
14.   请编写HBase语句获取表tbl_user的行键rk1列族info的数据。get 'tbl_user', 'rk1', 'info'
15.   请写出HBase语句删除表tbl_user中行键为rk1的数据。deleteall 'tbl_user', 'rk1'

大数据库练习题目集-文档数据库

判断题
1.   文档数据库主要目标是在键值存储方式（提供了高性能和高伸缩性）以及传统的关系数据系统（丰富的功能）之间架起一座桥梁，集两者的优势于一身。T
2.   MongoDB是一个基于分布式文件存储的数据库。T
3.   MongoDB 数据库是一个面向集合且模式自由的文档类型数据库。T
4.   文档数据库允许创建许多不同类型的非结构化的或任意格式的字段。T
5.   MongoDB中，同一集合内，表格中每行数据的模式并不需要相同。T
6.   集合是一组MongoDB的文件。集合中的文档可以有不同的字段。T
7.   MongoDB集合中的文档的字段是相同的。F
8.   MongoDB 的文档不需要设置相同的字段，并且相同的字段不需要相同的数据类型T
9.   MongoDB 的文档需要设置相同的字段，并且相同的字段需要相同的数据类型F
10.   MongoDB 的文档不需要设置相同的字段，相同的字段需要相同的数据类型F
11.   MongoDB 的文档需要设置相同的字段，只是相同的字段不需要相同的数据类型F
12.   MongoDB文档中的键/值对是无序的。F
13.   MongoDB的文档可以有重复的键。F
14.   当MongoDB的第一个文档插入时，不存在的集合就会被创建。T
15.   MongoDB分片后无法更改分片键的选择，且分片集合只能有一个分片键。T
16.   MongoDB分片后可以更改分片键的选择，分片集合只能有一个分片键。F
17.   MongoDB分片后无法更改分片键的选择，分片集合可以有多个分片键。F
18.   MongoDB分片后可以更改分片键的选择，分片集合可以有多个分片键。F
19.   在 MongoDB 中，你不需要创建集合。当你插入一些文档时，MongoDB 会自动创建集合。T
单选题
1.   MongoDB支持（）和（）两种分片策略，用于跨分片集群分发数据。哈希分片，范围分片
2.   MongoDB 创建数据库的命令是（）。USE
填空题
1.   Capped collections 按照文档的插入顺序保存到集合中，文档在磁盘上存放位置是按照插入顺序来保存的。
2.   当我们更新MongoDB的Capped collections 中文档的时候，更新后的文档不可以超过之前文档的大小。
3.   为了在集合中分发文档，MongoDB使用分片键对集合进行分区。
主观题
1. 在数据库test的集合mycol中创建以键keyname降序的唯一索引。
use test;
db.mycol.createindex({keyname:-1},{"unique":true});
2.找出数据库test中集合driverPoint的坐标coordinate位于以圆心(118.0,24.0)与半径为10构成的圆心范围内的文档。
db.driverPoint.find(
{
coordinate:{
   $geowithin:{
   $center:[[118.0,24.0],10]
   }
   }
}
);
3.找出数据库test中集合driverPoint的坐标coordinate位于以点(118.0,24.0)与点(120.0,30.0)构成的矩形范围内的文档。
db.driverPoint(
{
coordinate:{
$geowithin:{
$polygon:[[118.0,24.0],[120.0,30.0]]
}
}
}
);
4. 在MongoDB的test 数据库中创建 mycol 集合，请写出语句。use test;
db.createCollection("mycol");

5. 在MongoDB的test数据库中删除集合 mycol，请写出语句。use test;
db.mycol.drop();
6. 将MongoDB的数据库test的集合mycol中name为"张三"的文档age修改为35，请写出语句。
use test;
db.mycol.save({
"name":"张三",
"age":35
});
7.将MongoDB的数据库test的集合mycol中name为"李四"的文档删除，请写出语句。
use test;
db.mycol.remove({"name":"李四"});
8. 在MongoDB的数据库test中，查询集合mycol中age大于20而小于50的文档。请写出查询语句。
use test;
db.find({mycol:{$age:50,$age:20}});
9.   在MongoDB的数据库test中，为集合mycol的name和age列创建复合索引。请写出语句。未做
10.   在MongoDB的数据库test中，查询集合mycol中age>20或name为"李四"的文档，要求只显示name键。请写出查询语句。未做
11.   向MongoDB的数据库test的集合mycol中插入两个新文档，新文档有两个字段 name和age，文档一的值分别为"张三"和25，文档二的值分别为"李四"和32。未做
大数据库练习题目集-图数据库
判断题
1.   图数据库中图是顶点和边的集合。T
2.   图数据库中图是一些节点和关联这些节点的联系的集合。T
3.   图数据库是存储图片的数据库。F
4.   图数据库中关系是无向的。F
5.   属性图不允许每个节点和边有一组可变的属性列表。F
6.   图数据库通过事务来保证一致性。T
7.   图数据库允许出现悬挂关系。F
8.   图数据库在删除节点时可同时删除其上的关系。F
9.   属性图模型中节点包含属性，而关系不包含属性。F
10.   属性图模型中节点和关系都可以包含属性。T
11.   图数据库中路径表示遍历属性图，由一系列交替的节点和关系组成。T
12.   Neo4j中节点存储区是固定大小的记录存储。T
13.   Neo4j中联系存储区的记录大小是可变的。F
14.   Neo4j中属性记录是固定大小的。T
15.   在Neo4j中要定义字符串类型属性值，需要使用单引号或双引号。T
16.   在Neo4j中UNION子句返回没有重复的数据行。T
17.   在Neo4j中UNION ALL子句返回没有重复的数据行。F
单选题
1.   图数据库中节点可有（）个标签，但是关系必须且只能设置一个关系类型。
零到多
2.   图数据库在修改节点或向现有节点新增关系之前，必须先( )事务。启动
3.   图数据库中最短的路径仅包含（），其长度为（）。单个节点，0
4.   Neo4j中创建节点，关系和属性的命令是（）。CREATE
5.   Neo4j中获取有关节点，关系和属性数据的命令是（）。MATCH
6.   Neo4j中删除节点和关系的命令是（）。DELETE
7.   Neo4j中删除节点和关系的属性的命令是（）。REMOVE
8.   Neo4j中添加或更新标签的命令是（）。SET
9.   在Neo4j中，创建索引的命令是（）。CREATE INDEX
10.   在Neo4j中，删除索引的命令是（）。DROP INDEX
11.   在Neo4j中，创建唯一约束的命令是（）。CREATE CONSTRAINT
12.   在Neo4j中，删除唯一约束的命令是（）。DROP CONSTRAINT
填空题
1.   图数据库中一个属性图是由顶点，边，标签，关系类型和属性组成的有向图。
2.   图数据库中关系通过关系类型来分组，关系类型相同的关系属于同一个集合。
3.   图数据库中节点可有零个，一个或多个标签，但是关系必须且只能设置一个关系类型。
4.   图数据库在删除节点前，必须先移除其上的关系。
5.   图数据库通过事务来保证一致性。
6.   图数据库在修改节点或向现有节点新增关系之前，必须先启动事务。
7.   图数据库中路径表示遍历属性图，由一系列交替的节点和关系组成。
8.   在Neo4j中，使用UNION与UNION ALL将数据合并，两子句对应列的名称和数据类型应该相同。
9.   Neo4j CQL提供LIMIT子句来限制查询返回的行数。它修剪CQL查询结果集底部的结果。
10.   Neo4j CQL提供LIMIT子句来过滤或限制查询返回的行数。它修剪CQL查询结果集底部的结果。
11.   Neo4j CQL提供SKIP子句来过滤或限制查询返回的行数。它修剪CQL查询结果集顶部的结果。
12.   Neo4j CQL提供SKIP子句来限制查询返回的行数。它修剪CQL查询结果集顶部的结果。
13.
在Neo4j中，命令CREATE与MERGE都可以向数据库中添加节点，其区别是CREATE总是向数据库中添加节点，而MERGE只有当节点不存在时才向数据库中添加节点。
主观题
1.   在Neo4j数据库中请写出语句创建一个带标签“Employee”的名为emp的节点。CREATE (emp:Employee)
2.   在Neo4j数据库中请写出语句创建一个带标签Dept的名为d的节点，节点属性信息为deptno=10，dname="开发部"，location="广州"。CREATE (d:Dept { deptno:10,dname:"开发部",location:"广州" })
3.   在Neo4j数据库中请写出语句查询Employee标签下name="Lokesh"的节点。MATCH (p:Employee {name:"Lokesh"}) RETURN p
4.   在Neo4j数据库中请写出语句查询Dept节点的属性deptno和dname数据。MATCH (dept: Dept) RETURN dept.deptno,dept.dname
5.   在Neo4j数据库中请写出语句创建一个从节点Profile1到节点Profile2的关系LIKES。CREATE (p1:Profile1)-[r1:LIKES]->(p2:Profile2)
6.   在Neo4j数据库中请写出语句查询Employee节点两个名为“Abc”或“Xyz”的员工详细信息。MATCH (emp:Employee) WHERE emp.name = 'Abc' OR emp.name = 'Xyz' RETURN emp
7.   在Neo4j数据库中请写出语句删除Employee节点。MATCH (e: Employee) DELETE e
8.   在Neo4j数据库中请写出语句删除两个节点CreditCard、Customer及其关联的关系。MATCH (cc: CreditCard)-[rel]-(c:Customer) DELETE cc,c,rel
9.   在Neo4j数据库中请写出语句删除节点DebitCard的cvv属性。MATCH (dc:DebitCard) REMOVE dc.cvv RETURN dc
10.   在Neo4j数据库中请写出语句删除节点Movie的Picture标签。MATCH (m:Movie) REMOVE m:Picture RETURN m
11.   在Neo4j数据库中请写出语句向现有 Book节点添加新属性title，其值为 'superstar'。MATCH (book:Book) SET book.title = 'superstar' RETURN book
12.   在Neo4j数据库中请写出语句查询员工节点Employee的属性empid,name,salary,deptno，并按name降序排序。MATCH (emp:Employee) RETURN emp.empid,emp.name,emp.salary,emp.deptno ORDER BY emp.name DESC
13.   在Neo4j中，请写出语句查询Employee节点的id,name属性，要求id属性不为空。MATCH (e:Employee) WHERE e.id IS NOT NULL RETURN e.id,e.name
14.   在Neo4j中，请写出语句查询Employee节点的id,name属性，要求id的值为1，3，5之一。MATCH (e:Employee) WHERE e.id IN [1,3,5] RETURN e.id,e.name
15.   在Neo4j中请写出语句将test节点中name属性中的"abC"替换成"Aaa"。MATCH (x:test) RETURN REPLACE(x.name,"abC","Aaa")
16.   在Neo4j中，请写出语句查询数据库中可用的Employee节点数。MATCH (e:Employee) RETURN COUNT(*)
17.   在Neo4j中，员工节点Employee的工资属性为sal，请写出语句从所有员工节点Employee中查找最高和最低工资值。MATCH (e:Employee) RETURN MAX(e.sal),MIN(e.sal)
18.   在Neo4j中，员工节点Employee的工资属性为sal，请写出语句查找所有员工节点的工资总和和平均工资。MATCH (e:Employee) RETURN SUM(e.sal),AVG(e.sal)
19.   在Neo4j中，请写出语句在Customer节点的name属性上创建索引。CREATE INDEX ON :Customer (name)
20.   在Neo4j中，请写出语句删除Customer节点的name属性上的索引。DROP INDEX ON :Customer (name)
21.   在Neo4j中，请写出语句在CreditCard节点的number属性上创建一个UNIQUE约束。CREATE CONSTRAINT ON (cc:CreditCard) ASSERT cc.number IS UNIQUE
22.   在Neo4j中，请写出语句从CreditCard节点的number属性删除现有UNIQUE约束。DROP CONSTRAINT ON (cc:CreditCard) ASSERT cc.number IS UNIQU

星河欲转。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
3
评论
《大数据库》题库

2. 在Neo4j数据库中请写出语句创建一个带标签Dept的名为d的节点，节点属性信息为deptno=10，dname="开发部"，location="广州"。7. 以下正确的是：（）。14. 在Neo4j中，请写出语句查询Employee节点的id,name属性，要求id的值为1，3，5之一。15. 在redis数据库中，删除列表键listkey1的内容，要求保留列表键listkey1中从startval到endval之间的值，请写出相应语句。
复制链接

扫一扫