数据仓库
文章平均质量分 60
时代新人0-0
大数据技术爱好者 邮箱:2546008409@qq.com
展开
-
如何在使用窗口函数的时候使用groupby
先说结论:groupby的执行先于窗口函数,也就是说对于非groupby字段而言,聚合函数先于窗口函数执行。过去写的sql很少在使用group by操作的同时使用窗口函数,主要是这种情况少见且在写sql时会刻意规避同时使用的情况。但是,同时使用两者在解决部分查询问题时能提供很大的遍历。今天回顾过去写的sql时发现这么一道必须同时使用窗口函数和groupby的题目。牛客网sql进阶中第五小结SQL1。原创 2024-09-10 21:50:22 · 996 阅读 · 0 评论 -
在数仓项目开发过程中常使用的命令
记录并汇总了常用linux命令原创 2024-07-17 11:20:46 · 254 阅读 · 0 评论 -
hive中的join操作及其数据倾斜
简要介绍了在hive中进行join操作可能遇到的若干问题原创 2024-05-29 16:41:36 · 1281 阅读 · 0 评论 -
hivesql如何在数据量超大时避免join操作
探讨了一种在数据量超大的情况下避免join操作的方法原创 2024-05-29 10:11:25 · 355 阅读 · 0 评论 -
NoMatchingMethodException No matching method for class org.apache.hadoop.hive.ql.udf.UDFToString
本文主要通过一个错误提醒读者,要注意表结构与select语句各字段的一一对应原创 2024-03-05 16:47:45 · 866 阅读 · 0 评论 -
什么是onedata?如何使用onedata?
介绍了onedata,并讲解了onedata的实施过程原创 2023-12-31 21:26:26 · 1225 阅读 · 0 评论 -
数据仓库如何评价数据模型的好坏
汇总了评价数据仓库中数据模型好坏的一般指标原创 2023-12-24 21:08:21 · 379 阅读 · 0 评论 -
什么是拉链表
本文简单介绍了拉链表原创 2023-12-06 18:01:02 · 405 阅读 · 0 评论 -
什么是数据倾斜
简单介绍了数据倾斜并对数据倾斜场景进行案例分析原创 2023-12-05 21:55:16 · 205 阅读 · 0 评论 -
数仓建模方法汇总
本文总结并介绍了四种数仓建模方法原创 2023-12-04 21:47:21 · 154 阅读 · 0 评论 -
星型模型和雪花模型简介及其对比
本文用通俗易懂的语言介绍了星型模型和雪花模型,并针对这两个模型进行了对比原创 2023-12-01 16:18:04 · 1277 阅读 · 0 评论