数仓工具—Hive实战之描述性计算(18)

本文通过实例介绍了如何使用Hive进行描述性计算,包括统计全都合格的打卡人数和计算连续增长的销售情况。通过将‘全都’转化为‘任意’的条件判断,简化了问题并得出解决方案,强调了等价转换和边界条件的重要性。
摘要由CSDN通过智能技术生成

描述性计算

Hive实战之事件序列匹配/复杂事件处理 一样,这个名字也是我随意起得,名字虽然很随意但是目的不随意,我还是希望能像设计模式一样,将这一类的问题抽象出来,然后形成一个统一的解决方案,这里我们先不说结论什么的,直接通过例子演示,然后再总结出规律。

统计全都合格打卡人数

我们有一张表,里面存储里用户的打卡情况,我们希望统计出每天合格的人数,合格和不合格有一个字段标识,用户可以一天多次打卡,统计的业务逻辑是只有要一次不合格就不合格也就是任意一次不合格就是不合格,全都合格才是合格。

这里我们首先思考一个问题,想清楚了我们就开始写SQL,那就是到底是判断合格容易还是不合格容易,假设我们一个用户每天打10次卡,那我们判断合格就得这10次打卡全部合格,同理如果打20次卡,那就得判断20次打卡全部合格,但是用户打卡的次数是随意的,所以我们看出你要判断合格,就得知道用户到底打了多少次卡,然后判断全部打卡是否合格。

但是这个时候要判断不合格就人简单了,任意一次打卡不合格或者是存在打卡就是不合格了。下面我们就统计每个用户的不合格的次数

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
Hadoop Hive数仓实战项目是基于Hadoop和Hive技术的数据仓库项目。在这个项目中,使用Hadoop集群来存储和处理大规模的数据,并使用Hive作为数据仓库的查询和分析工具。 在项目中,首先需要添加一个hadoop用户组,并创建一个hadoop用户,并设置用户密码。然后,切换到hadoop用户,并启动Hive。通过Hive,可以执行一系列的命令,如展示数据库、退出等操作。 引用中提到,Hive建立在Hadoop之上,具有与Hadoop相同的可扩展性,可以轻松应对大规模的数据处理需求。这意味着Hadoop Hive数仓实战项目可以处理大规模的数据,并能够支持超过1000个节点的Hadoop集群。 另外,引用中提到了一些配置文件的重要性,如hive-site.xml和hive-default.xml,它们可以通过设置-hiveconf参数来进行配置。 综上所述,Hadoop Hive数仓实战项目是一个基于Hadoop和Hive技术的大规模数据仓库项目,可以通过Hive进行数据查询和分析,并具有与Hadoop相同的可扩展性。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [大数据开发基础入门与项目实战(三)Hadoop核心及生态圈技术栈之3.数据仓库工具Hive基础](https://blog.csdn.net/CUFEECR/article/details/121189073)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不二人生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值