Hive 目前已经成为 Hadoop 大数据离线分析的标准工具,Hive 入门比较容易,但是深入还是有些困难。本次分享目的是带领大家快速入门 Hive,侧重于实用应用,并有一些原理和优化的内容。本场 Chat 的主要内容包括:
- Hive介绍
- 数据类型
- DDL语法
- DML语法
- HQL语法
- 连接
- 排序
- 自定义函数
- Hive执行原理
- Hive性能优化
- Hive高级知识
实录提要:
- 和 Hive 类似的工具还有哪些,能否做一个简单的比较和使用场景分析?
- Hive 有好的活跃社区推荐吗?
- Hive 与 SparkSQL 的目标与实现机制主要有何差异?适用场景有分别吗?
- 想知道如何进行 Hive SQL 的查询优化,有没有相关书籍推荐?
- 关于更新目标表,有哪几种比较好的处理方法?
- 推荐下关于 Hive 转 Mapreduce 原理或优化 Hive SQL 的书籍或博客之类的资料?
- Hive 的运维难度相比同类工具,难易程度?
阅读全文: http://gitbook.cn/gitchat/activity/5923fe6cdcac8b4e79ddf889
您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。