【云平台技术】作业八

最新推荐文章于 2024-02-05 16:36:00 发布

萝小北

最新推荐文章于 2024-02-05 16:36:00 发布

阅读量986

点赞数

文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51941741/article/details/131454063

版权

一、填空题

1、数据仓库是面向主题的、集成的、非易失的和时变的数据集合，用于支持管理决策。

2、Hive默认元数据存储在 Derby数据库数据库中。

3、Hive建表时设置分割字符命令 row format delimited fields terminated by char 。

4、Hive查询语句select ceil(2.34)输出内容是 3 。

5、Hive创建桶表关键字 clustered by ，且Hive默认分桶数量是 -1 。

二、判断题

1、Hive使用length()函数可以求出输出的数量。（×）

2、再创建外部表的同时要加载数据文件，数据文件会移动到数据仓库指定的目录下。（×）

3、Hive是一款独立的数据仓库工具，因此在启动前无需启动任何服务。（×）

4、Hive默认不支持动态分区功能，需要手动设置动态分区参数开启功能。（√）

5、Hive分区字段不能与已存在字段重复，且分区字段是一个虚拟的字段，它不存放任何数据，该数据来源于装载分区表时所指定的数据文。（√）

三、选择题

1、Hive是建立在（ C ）之上的一个数据仓库

A、HDFS

B、MapReduce

C、Hadoop

D、HBase

2、Hive查询语言和SQL的一个不同之处在于（ C ）操作

A、Group by

B、Join

C、Partition

D、Union

3、Hive最重视的性能是可测量性、延展性、（ B ）和对于输入格式的宽松匹配性

A、较低恢复性

B、容错性

C、快速查询

D、可处理大量数据

4、以下选项中，哪种类型间的转换是被Hive查询语言所支持的（ D ）

A、Double—Number

B、BigInt—Double

C、Int—BigInt

D、String--Double

5、按粒度大小的顺序，Hive数据被分为：数据库、数据表、（ C ）、桶？

A、元祖

B、栏

C、分区

D、行

四、简答题

1、简述Hive的特点是什么。

答：Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供完整的SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。

2、简述Hive中内部表与外部表区别。

答：创建表阶段：

外部表创建表的时候，不会移动数到数据仓库目录中（/user/hive/warehouse），只会记录表数据存放的路径，内部表会把数据复制或剪切到表的目录下。

删除表阶段：

外部表在删除表的时候只会删除表的元数据信息不会删除表数据，内部表删除时会将元数据信息和表数据同时删除

五、编程题

1、创建字段为id、name的用户表，并且以性别gender为分区字段的分区表。

答：create table t_user (id int, name string)

partitioned by (gender string)

row format delimited fields terminated by ',';

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【云平台技术】作业八

答：Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供完整的SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行。外部表创建表的时候，不会移动数到数据仓库目录中（/user/hive/warehouse），只会记录表数据存放的路径，内部表会把数据复制或剪切到表的目录下。5、Hive分区字段不能与已存在字段重复，且分区字段是一个虚拟的字段，它不存放任何数据，该数据来源于装载分区表时所指定的数据文。1、Hive是建立在（ C ）之上的一个数据仓库。
复制链接

扫一扫

萝小北 CSDN认证博客专家 CSDN认证企业博客

码龄4年

22: 原创

128万+: 周排名

110万+: 总排名

2万+: 访问

: 等级

265: 积分

35: 粉丝

32: 获赞

23: 评论

166: 收藏

私信

关注

热门文章

最新评论

【Oracle】实验04：控制文件管理
wsfwqq: 学长牛批
【云平台技术】Hadoop全分布式安装与配置
m0_68949064: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文。
【云平台技术】Hadoop全分布式安装与配置
在奔跑的小羊: 欧克，已解决
【云平台技术】Hadoop全分布式安装与配置
在奔跑的小羊: 为什么我的第三个虚拟机显示未能启动虚拟机
【云平台技术】Hadoop全分布式安装与配置
TUK_sdk: hadoop01的ip设置为192.168.137.131可能会出现连不上ssh的情况，出现的话改成其他的比如192.168.137.134之类的

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。