目录
Hive概述:
优缺点:
架构:
安装
derby优缺点:
例子:
使用:
ddl语句:
表操作:
建表:
dml:
1.load加载数据
分区表的数据插入:
分桶表数据的插入:
Fetch过程
join
数据类型:
Hive视图
Hive内置函数:
Hive自定义函数:
补全ip:split需要转义
Json解析:
例子:
多分隔符读入问题:
Hive的shell操作:
进入hive之前:
Hive优化和原理
合理分桶:
Hive执行原理:
join过程:
groupby:
去重:
数据倾斜:
尽量避免策略: