一、概述
- Hive 由 Facebook 实现并开源
- 是基于 Hadoop 的一个数据仓库工具
- 可以将结构化的数据映射为一张数据库表
- 并提供 HQL(Hive SQL)查询功能
- 底层数据是存储在 HDFS 上
- Hive的本质是将 SQL 语句转换为 MapReduce 任务运行
- 使不熟悉 MapReduce 的用户很方便地利用 HQL 处理和计算 HDFS 上的结构化的数据,适用于离线的批量数据计算。
二、hive安装及配置mysql
参考https://www.cnblogs.com/ianduin/p/7679239.html
https://blog.csdn.net/lblblblblzdx/article/details/79746649
三、hive例子
3.1创建表
- 第一行声明创建一个表及其字段
- 第二行声明数据文件的每一行 是由制表符分割的文本
- 第三行表示字段分割标识为空格
3.2导入数据
导入本地上的文件
3.3查询最高气温