Hive 专栏

本文探讨了数据仓库在企业竞争中的重要性,强调Hive作为数据服务基石的角色,随着实时数仓的发展,Hive在数据战争中的核心地位。文章涵盖了Hive的基础概念、安装、操作、语法、进阶特性以及与其他技术的集成,深入展示了其在大数据技术中的实际应用和优化策略。
摘要由CSDN通过智能技术生成

Hive 专栏

数据仓库已经是企业的数据竞争的核心了,学好数据仓库对提高自己和找到一份好的工作都至关重要,但是很多人对数仓的印象还是停留在写SQL的层面,其实今天的数仓更像是一个数据平台应用,我们学习的大数据技术其实最终的价值都体现在数据服务上,数仓是数据服务的基石,如果说业界以前还有离线和实时之分的话,那么现在实时数仓的提出与落地,未来数仓将是数据战争的最激烈的战场,一切大数据技术都将为数仓提供服务,也都将在数仓这一环节进行收口。

编号分类文章
1基础篇1. 什么是Hive
2基础篇2. Hive的编译安装
3基础篇3. Hive表的基础操作
4基础篇4.Hive数据的组织管理方式
5基础篇5. Hive内部表和外部表
6基础篇6. Hive动态分区
7基础篇7.Hive命令行
8基础篇8. Hive基本数据类型
9基础篇9.Hive复合数据类型
10基础篇10. Hive Streaming
11基础篇11.Hive关键字
12基础篇12.Hive函数大全
13基础篇13.Hive的架构设计
14基础篇14.Hive架构之HiveServer2
15基础篇15.Hive的其他语言调用
16基础篇16.Hive架构服务
17基础篇17.Hive的严格模式和本地模式
18基础篇18.Hive的执行引擎
19基础篇19.Hive视图和物化视图
20基础篇20.Hive UDF
21基础篇21.Hive Metastore
22基础篇22.MetaStore的standalone模式和高可用
23基础篇23.Hive基础之设置变量
24基础篇24.报错后退出执行
25语法篇1. Json 解析
26语法篇2. like rlike regexp
27语法篇3. explode 和 lateral view
28语法篇4. with as和from
29语法篇5.Order by, Sort by ,Dristribute by,Cluster By
30语法篇6.grouping sets
31语法篇7.cube和rollup
32语法篇8.map join、reduce join、smb join
33语法篇9.窗口函数初识 max count sum
34语法篇10.窗口函数row_number、rank、dense_rank
35语法篇11. 窗口函数ntile
36语法篇12.窗口函数first_value和last_value
37语法篇13.窗口函数lead和lag
38语法篇14. 窗口函数cume_dist和 percent_rank
39语法篇15. 窗口函数练习和总结
40语法篇16. Hive语法之抽样
41语法篇17. collect_set 和 collect_list
42语法篇18. 行列转换
43语法篇19.Hive语法之子查询
44语法篇20.Hive语法之物理分组
45语法篇21.Hive语法之复杂json解析处理
46语法篇22.Hive语法之with扩展
47语法篇23.Hive语法之Merge 语句
48语法篇24.Hive语法之join 扩展
49语法篇25.Hive语法之连续full join主键重复
50进阶篇1. Hive进阶之索引
51进阶篇2.Hive进阶之事务初识
52进阶篇3.Hive进阶之事务深度剖析
53进阶篇4.Hive进阶之执行计划
54进阶篇5.Hive进阶之数据存储格式
55进阶篇6.Hive进阶之数据压缩配置与格式
56进阶篇7. Hive进阶之SerDe
57进阶篇8. Hive进阶之权限管理
58进阶篇10.Hive优化指南
59进阶篇11.Hive进阶之优化map任务数量
60进阶篇12.Hive进阶之优化reduce任务数量
61进阶篇13.Hive进阶之优化小文件问题
62进阶篇14.Hive进阶之谓词下推
63进阶篇15.Hive进阶之归档
64进阶篇16. Hiv进阶之MSCK
65进阶篇17.Hive进阶之Hive中的锁
66进阶篇18.Hive进阶之各种join的执行计划
67进阶篇19. Hive进阶之InputFormat 和 OutputFormat
68进阶篇20.Hive进阶之MultiDelimitSerDe
69进阶篇21. Hive进阶之查询最佳实践
70进阶篇21. Hive进阶之Statistics与Analyze Table命令
71进阶篇22. Hive进阶之表设计最佳实践
72进阶篇23.Hive进阶之性能优化最佳实践
进阶篇24. Hive进阶之StorageHandler
进阶篇25. Hive进阶之常见的StorageHandler
73源码篇1.源码环境搭建
74源码篇2. cli 模块
75源码篇3.CliDriver
76源码篇4.Beeline/HiveCli
77源码篇5.扩展篇Thrift
78源码篇6.SQL 解析
79源码篇7.SQL解析之Antlr入门
80源码篇8. SQL解析Antlr进阶
81源码篇9.SQL解析的应用SQL优化
82实战篇1.Hive实战之UDF分词
83实战篇2.Hive实战之UDF IP 解析
84实战篇3.Hive实战之UDF SQL 解析
85实战篇4.Hive实战之拉链表
86实战篇5.Hive实战之用户行为记录session分割
87实战篇6.Hive实战之最大连续登陆
88实战篇7.Hive实战之留存分析
89实战篇8.Hive实战之各种join的经典应用
90实战篇9.Hive实战之漏斗分析
91实战篇10.Hive实战之累计计算
92实战篇11.Hive实战之占比同比环比
93实战篇12.Hive实战之自关联经典案例
94实战篇13.Hive实战之日活跃周活跃月活
95实战篇14.Hive实战之full join 经典案例
96实战篇15.Hive实战之UDF外部依赖文件找不到
97实战篇16.Hive实战之对比分析
98实战篇17.Hive实战之事件序列匹配/复杂事件处理
99实战篇18.Hive实战之UDF GIS
100实战篇19.Hive实战之描述性计算
101实战篇20.Hive实战之滑动/滚动时间窗口计算
102实战篇21.Hive实战之UDF 复杂JSON 处理
103实战篇22.Hive实战之UDF汉字首字母
104实战篇23.Hive实战之生成连续序列
105集成篇1.Hive集成篇之ES
106集成篇2.Hive集成篇之ClickHouse
107集成篇3.Hive集成篇之Kafka
108集成篇4.Hive集成篇之UDF写ES
109优化篇1.用户画像亿级数据表关联
110优化篇2.UDAF批量调用外部请求
  • 26
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值