hive
文章平均质量分 84
大数据的奇妙冒险
金融业大数据领域项目经理,持有PMP及系统架构设计师证书
展开
-
大数据面试题:用 SQL 查询每个用户最大连续登录日期
“如何用 SQL 查询每个用户最大连续登录日期?”这道题是数据开发面试经常问到的题目,因为其比较考验候选人的 SQL 能力,今天就来简单讲讲其思路。原创 2022-12-06 08:45:00 · 908 阅读 · 0 评论 -
浅谈 Hive 数据倾斜原因及解决方案
大数据开发过程中,经常会遇到数据倾斜的问题,也是面试必问的问题。今天就来说一下数据倾斜的原因及其解决方法。原创 2022-12-02 13:12:52 · 821 阅读 · 0 评论 -
hive从入门到放弃(六)——文件存储格式
hive从入门到放弃系列第六篇:文件存储格式,关注【大数据的奇妙冒险】解锁更多新知识!原创 2022-05-16 08:00:00 · 1247 阅读 · 0 评论 -
常见的窗口函数汇总
老规矩,还没看前面的文章而且对这些知识点不熟悉的,可以点击连接进行观看哦:hive从入门到放弃(一)——初识hivehive从入门到放弃(二)——DDL数据定义hive从入门到放弃(三)——DML数据操作hive从入门到放弃(四)——分区与分桶话不多说,直接开始。什么是窗口函数相信很多人都比较熟悉 SQL 聚合函数的语法,比如 count(), sum(), max()等,窗口函数类似聚合函数,不同的是窗口函数不改变原有的行。窗口函数是数据分析和数据开发必备的技能。基本语法:<窗口原创 2022-04-20 10:41:28 · 2665 阅读 · 1 评论 -
hive从入门到放弃(四)——分区与分桶
hive从入门到放弃系列文章第四篇:分区与分桶 震撼上线原创 2022-04-02 13:31:08 · 3136 阅读 · 0 评论 -
hive从入门到放弃(三)——DML数据操作
上一篇给大家介绍了 hive 的 DDL 数据定义语言,这篇来介绍一下 DML 数据操作语言。没看过的可以点击跳转阅读:hive从入门到放弃(一)——初识hivehive从入门到放弃(二)——DDL数据定义数据写入数据导入部分默认数据文件格式为 textfile,每一列由‘,’进行分割,以换行分行。insertinsert 表示向表中插入数据,可以直接插入值,也可以通过查询其他表获取数据插入。INSERT INTO TABLE target_table VALUES (COL1.VALUE,原创 2022-03-20 13:53:10 · 2886 阅读 · 0 评论 -
hive从入门到放弃(二)——DDL数据定义
上一篇大致介绍了hive,包括其架构、数据类型等,这一篇写一下DDL语言,持续关注【大数据的奇妙冒险】,获得更多知识!原创 2022-03-16 15:55:43 · 3863 阅读 · 2 评论 -
hive从入门到放弃(一)——初识hive
带你入门 hive,本文介绍了什么是hive,hive的特点,hive的架构和运行机制以及数据结构,持续关注,解锁更多知识原创 2022-03-11 13:40:03 · 20705 阅读 · 1 评论