hive仓库练习题

选择题
  1. Hive是建立在(Hadoop)之上的数据仓库
  2. Hive默认分桶的数量是(-1)
  3. HiveQL和SQL的一个不同之处在于(Partition)操作
  4. 按粒度大小的顺序,Hive数据被分为数据库,数据表,分区和(桶)
  5. Hive查询语句中,select ceil(2.34);输出结果为(3)【向上取整】
题目1:

对input.txt进行分析,在hive中完成:
(1)创建一个数据库testdb
在这里插入图片描述
请添加图片描述
在这里插入图片描述
(2)创建内部表data,把input.txt的数据导入到data表
请添加图片描述

题目2:

在data表中完成统计math课程的平均分。
(可能会用到explode,split,cast内置函数,其中cast(a as int)是把字段a的值转换为整数)

方法一
请添加图片描述
explode()
score列是字符串
在这里插入图片描述
使用split()切割后经过MapReduce就变成了数组,所以explode函数就会把数据中数据都放到一列
在这里插入图片描述
如果直接把字符串放进去,会出现如下错误,也就是参数只能为数组或者map映射类型。
在这里插入图片描述

方法二
创建表格,注意这里的score不再是字符串,而是定义为int型的数组
在这里插入图片描述
导入数据
在这里插入图片描述
数据如下,可以看到每一列是按’:‘进行分割,列中的内容用’,'进行分割,放入数组中
在这里插入图片描述
扩展:lateral view
lateral view用于和split, explode等UDTF一起使用,它能够将一行数据拆成多行数据,在此基础上可以对拆分后的数据进行聚合。lateral view首先为原始表的每行调用UDTF,UTDF会把一行拆分成一或者多行,lateral view再把结果组合,产生一个支持别名表的虚拟表。---------引用自:https://www.jianshu.com/p/4804db6a3677

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: Hive是一个基于Hadoop的数据仓库工具,提供了类似于SQL的查询语言HiveQL,可以方便地进行数据分析和查询,适合大规模的数据处理。 在Hive的案例教程中,通常会包含一些习,以帮助学习者更好地理解和掌握Hive的使用。这些习可以涉及到不同的数据仓库场景和问,下面是一个示例: 假设我们有一个电商平台的销售数据,其中包含了订单表和商品表。订单表包括了订单ID、用户ID、商品ID、购买数量和购买日期等信息;商品表包括了商品ID、商品名称、商品价格和商品分类等信息。 1. 统计每个用户的购买总金额,并按照金额从高到低排序。 可以通过使用Hive的聚合函数和排序功能来实现这个需求。首先,需要使用JOIN操作将订单表和商品表进行关联,根据商品ID找到对应的商品价格。然后,通过GROUP BY用户ID进行分组,使用SUM函数计算每个用户的购买总金额。最后,使用ORDER BY将结果按照金额从高到低排序。 2. 统计每个商品分类的销售数量和销售金额。 同样地,可以通过使用JOIN操作将订单表和商品表进行关联。然后,通过GROUP BY商品分类进行分组,分别使用COUNT和SUM函数计算每个商品分类的销售数量和销售金额。 3. 找出销售金额最高的前5个商品。 可以通过使用ORDER BY和LIMIT子句来实现这个需求。先通过JOIN操作将订单表和商品表进行关联,然后使用SUM函数计算每个商品的销售金额。最后,使用ORDER BY对销售金额进行降序排序,并使用LIMIT 5获取前5个商品。 通过完成这些习,可以深入理解Hive的数据仓库功能,掌握基本的数据查询和分析。同时,也能够提升对数据仓库设计和实践的理解和能力。 ### 回答2: Hive数据仓库案例教程习是一种用于学习和实践Hive数据仓库的教育资源。它通过提供一系列的案例和习,帮助学习者深入理解Hive数据仓库的概念与应用,并通过实践加深对Hive的掌握。 该教程习通常包括以下内容: 1. 数据准备:习提供了一些数据资料,学习者需要根据具体的案例要求将数据导入到Hive中。这一步通常涉及到创建、管理表格、上传数据等操作。 2. 数据分析:习会提供一些具体的问或需求,学习者需要通过Hive的查询语句进行数据分析。这一步要求学习者熟悉Hive的查询语法和常用函数,并能够编写出符合要求的查询语句。 3. 结果验证:学习者需要将自己查询得到的结果与提供的标准答案进行对比。这一步能够检验学习者对Hive查询的准确性和熟练程度。 通过完成这些案例教程习,学习者可以逐步提升对Hive数据仓库的理解和实践能力。同时,这些习也能够帮助学习者巩固理论知识,拓宽在实际应用场景中的思考和解决问的能力。 总之,Hive数据仓库案例教程习是一种有助于学习者掌握Hive数据仓库技术的教育资源,通过实践案例和习,提升学习者的理论实践能力和问解决能力。 ### 回答3: Hive数据仓库案例教程习是为了帮助学习者更好地理解和掌握Hive数据仓库的相关知识和技能而设计的一系列练习题。 这些习通常会根据实际的数据仓库案例进行设计,包括数据的导入和清洗、数据的转换和处理、数据的查询和分析等方面的内容。学习者可以通过完成这些习,加深对Hive数据仓库的理解,并且提高自己在实际应用中的能力。 在这些习中,学习者需要运用到Hive的相关操作语句和函数,例如创建和管理表、加载和导入数据、定义表结构和分区等。同时,学习者还需要了解Hive的查询语言,如SQL,以及Hive的高级功能,如UDF自定义函数等。通过这些习,学习者可以从实际操作中不断提高和完善自己的技能。 总的来说,Hive数据仓库案例教程习是一种亲身实践的学习方法,通过实际的案例和练习,帮助学习者更好地掌握和应用Hive数据仓库的技术,达到提升数据分析和处理能力的目的。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值