1:CDH介绍
CDH是Cloudera的100%开源平台发行版,包括Apache Hadoop,专为满足企业需求而构建。CDH提供开箱即用的企业使用所需的一切。通过将Hadoop与十几个其他关键的开源项目集成,Cloudera创建了一个功能先进的系统,可帮助您执行端到端的大数据工作流程。
简单来说:CDH 是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具(软件),使得集群的安装可以从几天的时间缩短为几个小时,运维人数也会从数十人降低到几个人,极大的提高了集群管理的效率。
2:CDH现状分析
Cloudera公司合并Hortonworks公司之后(2018年10月份合并的),会将CDH和HDP这两个产品进行合并,推出一款统一旗舰产品CDP(Cloudera Data Platform),它也是Cloudera新兴的“企业数据云”战略的核心。
Cloudera宣布他们将继续支持现有的CDH和HDP平台一直到2022年1月,同时在这3年对现有的产品还会进行交叉组合。
目前CDP还不是特别成熟,所以目前在企业中使用的时候还是优先使用CDH或者HDP。
3:CDH集群规划(3台机器)
在实际工作中搭建CDH集群的话,理论上来说,集群机器数量肯定是越多越好的,如果资源有限的话,前期建议至少4台机器。
我在这里使用了3台,是因为我本地的物理服务器是24core、64g的,按照单机8core 16 g最多只能虚拟出来3台。
4台机器的话,针对Hadoop集群而言,可以设置为1主3从。
如果考虑到主

本文详细介绍了CDH6.2版本的大数据平台安装部署过程,涵盖集群规划、软件包下载、IP与主机名配置、防火墙关闭、互免密码登录、NTP时间服务器搭建、JDK安装、MySQL配置、Httpd服务安装以及Cloudera Manager的安装和CDH集群的启动与管理。通过这一系列步骤,实现了高效便捷的大数据环境部署。
订阅专栏 解锁全文
3322

被折叠的 条评论
为什么被折叠?



