一、Hive基本概念
1.什么是 Hive
2.Hive 的优缺点
3.Hive架构原理
4.Hive和数据库比较
二、Hive 安装
1.Hive安装地址
2.Hive 安装部署
3.MySQL安装
4.Hive 到 元数据配置到 MySQL
5.使用元数据服务的方式访问 Hive
6.使用 JDBC 问 方式访问 Hive
7. Hive常用交互命令
8.Hive其他命令操作
9.Hive常见属性配置
三、Hive数据类型
1.基本数据类型
2.集合数据类型
3.类型转化
四、DDL数据定义
1.创建数据库
2.查询数据库
3.修改数据库
4.删除数据库
5.创建表
注释:第一个NULL是因为1004 lisi无法转换为int,所以显示NULL,后面一个是因为找不到逗号,所以显示为NULL
6.修改表
五、DML数据操作
1.数据导入
2.数据导出
六、查询
1.基本查询(Select…From)
2.分组
3.Join语句
4.排序
七、分区表和分桶表
1.分区表
2. 分桶表
3.抽样查询
八、函数
1.系统内置函数
2.常用内置函数
扩展:
3. 自定义函数
4.自定义UDF函数
5.自定义 UDTF
课堂练习扩展:
九、压缩和存储
1. Hadoop压缩配置
2.开启 Map输出阶段压缩(MR引擎)
3.开启 Reduce 输出阶段压缩
4.文件存储格式
5.存储和压缩结合
十、企业级优化
1.执行计划(Explain )
2.Fetch抓取
3.本地模式
4.表的优化
5.合理设置Map及Reduce
6.并行执行
7.严格模式
十一、Hive 实战
1. 需求描述
2.数据结构
3.准备工作