Hive是大数据(hadoop)生态系统非常重要的一个工具,它提供了一种类SQL的语言,可以查询存储在Hadoop分布式文件系统(HDFS)中的数据,也可以查询Hadoop数据库(Hbase)中的数据,可以说通过Hive这个数据仓库工具大大降低了开发难度,对于数据分析师来说真的非常友好,只要使用SQL语言的分析师就可以轻松的使用Hive玩转大数据,当然Hive和其他的基于SQL的环境还是有一些差异,所以通过写这一系列文章来帮助数据分析人员学习Hive使用。
下面是学习Hive整体知识框架,我们会从最基本的安装配置到项目实战进行讲解,当然遇到疑惑的问题,一定要学会去思考和解决,你可以去百度,当然也可以和小编一起探讨。
- Hive基础知识
- Hive安装使用
- Hive数据类型与文件格式
- Hive数据定义(DDL)
- Hive数据操作(DML)
- Hive查询
- 函数