CDH(Cloudera Distribution for Hadoop)是一个由Cloudera公司发布的,包含了Apache Hadoop和很多其他开源软件的发行版。在安装CDH集群之前,你需要准备好若干台机器,每台机器上都需要安装操作系统(建议使用Linux)。
- 准备安装环境
- 确保所有机器已经安装了操作系统,并且可以通过SSH从远程终端登录。
- 在所有机器上安装Java 8或更高版本。CDH需要Java才能正常工作。
- 准备一个域名解析服务器,并且在所有机器上都能解析出正确的域名。
- 下载CDH安装包
到Cloudera官网下载最新版的CDH安装包,并将它上传到一台机器上。
- 安装Cloudera Manager
CDH集群使用Cloudera Manager来管理群集中的所有节点。首先需要安装Cloudera Manager。
- 将CDH安装包解压到一个目录中。
- 运行安装程序:
cdcloudera-manager-installer
sudo bash install.sh
- 安装CDH组件
使用Cloudera Manager安装CDH组件,包括Hadoop、Hive、Spark等。
- 在浏览器中打开Cloudera Manager的Web界面。
- 使用默认的用户名和密码(admin / admin)登录。
- 选择“Add New Clusters”,按照向导提示完