Hive 可以将存储在 HDFS 中的结构化数据映射为数据库中的一张表,并提供了一种 SQL 方言对其进行查询。 这些SQL语句最终会翻译成MapReduce程序执行。Hive的本质就是为了 简化 用户编写MapReduce程序而生成的一种框架。它本身并不会存储和计算数据,完全依赖于HDFS和MapReduce。
安装 Hive 的主要步骤:
- 安装 Hadoop 版本:2.7.7
- 安装 MySQL(MetaStore) 版本:5.7
- 安装 Hive 版本:2.3.7
- 安装 DBeaver(客户端) 版本:7.1.0
检查Hadoop环境
- 查看 Hadoop 版本号
- 启动 Hadoop,检查进程是否正确
- 安装MySQL,使用以下命令:
- sudo apt-get install mysql-server
- 查看默认的账号和密码,使用以下命令:
- sudo cat /etc/mysql/debian.cnf