Cloudera Manager大数据管理平台介绍

简介

Cloudera企业解决方案包括Cloudera Hadoop发行版(Cloudera’s Distribution Including Apache Hadoop,简称CDH),Cloudera Manager(CM)等。概括起来说,Cloudera提供一个可伸缩,稳定的,综合的企业级大数据管理平台,它拥有最多的部署案例,提供强大的部署,管理和监控工具。Cloudera Manager提供Admin Console,这是基于Web的用户界面,使得企业数据管理更加容易方便。Coudera Manager易于升级和安装Hadoop组件,还提供了在几分钟之内建立集群主节点的高可用(High Availability)。它还包括Cloudera Manager API,可用来获取集群运行状态以及配置Coudera Manager。

Cloudera Manager有四大功能:
(1)管理:对集群进行管理,如添加、删除节点等操作。
(2)监控:监控集群的健康情况,对设置的各种指标和系统运行情况进行全面监控。
(3)诊断:对集群出现的问题进行诊断,对出现的问题给出建议解决方案。
(4)集成:对hadoop的多组件进行整合。

Cloudera Manager概述

Cloudera Manager(简称CM)是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控管理的组件,对集群中主机,Hadoop,Hive,Spark等服务的安装和配置做了极大的简化。他是Hadoop集群的软件分发及管理平台,通过它可以快速部署好一个Hadoop集群,并对集群的节点及服务进行实时监控。详情参见:官方链接

Cloudera Manager功能概述

一.状态管理
  (1)Cloudera Manager Server 维护了集群的各种状态。状态可分为两类:模块和运行时,两者都存储于CMS的数据库中。
  (2)模块包含集群,主机,服务,角色,配置。运行时包含进程,命令。

二.配置管理(CM在多个层面定义了配置)
  (1)服务层面
      可定义整个服务实例层面的配置,如HDFS服务的默认副本因子,
  (2)角色组层面
      可定义某个角色组的配置,如DataNode的处理线程数量,可根据DataNodes的不同分组进行不同的配置。
  (3)角色层面
      可覆盖从角色层面继承的配置。这种配置需要谨慎使用,因为会造成角色组中的配置分歧。如因为拍错需求临时启用某个角色实例的DEBUG日志。
  (4)主机层面
      根据监控,软件管理,资源管理的不同有不同的配置。
  (5)CM自身也有很多与管理操作相关的配置。

三.进程管理
  (1)非CM管理的集群使用脚本进行角色进程的启动,但在CM管理的集群中这类脚本不起作用。
  (2)CM管理的集群中,只能使用CM进行角色进程的启停,CM使用开源的进程管理名为supervisord,其会启动进程,重定向日志,通知进程失败,为进程设置正确的用户ID等等。CM支持自动重启一个崩溃的进程。如果一个进程在启动会频繁崩溃,还会被大声非健康标记。
  (3)停止CMS和CM代理不会使正在运行的进程被中止。

四.软件包管理
  CM支持两种软件分发格式:packages和parcels。
  (1)package
      是一种二进制分发格式,包含编译的代码和元数据如包描述,版本,依赖项。包管理系统评估此元数据以允许包搜索,执行升级,确保包的所有依赖关系得到满足。CM使用本地操作系统支持的包管理程序。
  (2)parcel
      也是一种二进制分发格式,包含CM需要使用的附加元数据。其余package的却别有:可安装同一个parcel的多个版本,并激活其中一个;parcel可安装到任何路径;通过parcel安装,CM会自动下载并激活和每个节点操作系统版本匹配的parcel包,解决某些操作系统版本不一致问题。

五.主机管理
  (1)CM提供了多种功能以管理Hadoop集群的主机。第一次运行CM管理控制台时,可搜索主机并添加到集群,一旦选中了主机就可以为其分配CDH角色。CM会在主机上自动部署作为集群托管节点所有软件:JDK,CM agent,CDH,Impala,Solr等等。
  (2)服务部署并运行后,管理员控制台中的“Hosts”区域显示集群中托管主机的总体状态。提供的信息包括主机上的CDH版本,主机所属的集群,运行在主机上的角色的数量。Cloudera管理服务中的主机监控角色执行监控检查并收集主机的统计信息,以允许你监控主机的监控和性能。

六.资源管理
  CM允许使用两种资源管理方式:
  (1)静态资源池
      使用Linux cgroups在多个服务间静态进行资源隔离,如HBase,Impala,Yarn分别使用一定百分比的资源。静态资源池默认不启用。
  (2)动态资源池
      用于某些服务内部的资源管理,如Yarn的各种资源调度器,Impala也可对不同池中的查询动态分配资源。

七.用户管理
  (1)访问CM通过用户账户进行控制。用户账户标识如何对用户进行身份验证,并确定授予用户的权限。
  (2)CM提供了多种用户认证机制。可以配置CM使用CM数据库认证用户,或使用某种外部认证服务。外部认证服务可以是LADP服务器,或者指定的其他服务。CM还支持使用安全断言标记语言(SAML)来实现单点登录。

八.安全管理
  (1)认证:
      认证是指用户或服务证明其有访问某种系统资源的权限。Cloudera集群支持操作系统认证,LDAP,Kerberos等认证方式。LDAP和Kerberos并不是互斥的,很多时候可以一起使用。
  (2)授权:
      授权关注谁可以存取或控制指定的资源或服务。CDH目前支持以下几种权限控制:
        1>.传统的POSIX形式的目录和文件权限控制;
        2>.HDFS扩展的ACL细粒度权限控制;
        3>.HBase可对用户和组设置各种操作的ACL;
        4>.使用Apache Sentry进行基于角色的全下控制;
  (3)加密:
      集群不同层面存储和传输的数据支持不同的加密方式。

九.Cloudera管理服务
  Cloudera Management Service 实现了多种管理特性,包括活动监视,主机监控,服务监控,时间服务,告警发布,报表管理等。

Cloudera Manager基本核心功能

Cloudera Manager作为Hadoop大数据平台的管理工具,能够有效地帮助用户更容易地使用Hadoop。他的核心功能分为四大模块:管理功能,监控功能,诊断功能和集成功能。

一.Cloudera Manager提供的管理功能
  (1)批量自动化部署节点
      CM提供强大的Hadoop集群部署能力,能够批量的自动化部署节点。安装一个Hadoop集群只需添加安装的节点,安装需要的组件和服务角色这三步,大大缩短了Hadoop的安装时间,也简化来Hadoop的安装过程。
  (2)可视化的参数配置功能
      Hadoop包含许多组件,不同组件都包含各种各样的XML配置文件。CM提供界面GUI可视化参数配置功能。
  (3)智能参数验证以及优化
      当用户配置部分参数值有问题时,CM会给出智能错误提示,帮助用户更合理地修改配置参数。
  (4)高可用配置
      CM对关键的组件使用HA部署,如NameNode高可用可以通过CM的Web管理界面,根据向导启用HDFS HA。
  (5)权限管理
      提供不同级别的管理权限,比如只度用户访问Cloudera Manager的界面时,所有服务对应的启停等操作选项都不可用。

二.Cloudera Manager提供的监控功能
  (1)服务监控
      查看服务和实力级别健康检查的结果,对设置的各种指标和系统运行情况进行全面监控。如果任何运行情况测试是不良(Bad),则服务或者角色的状态就是不良(Bad)。如果结果运行状况存在隐患(Concering,没有任意一项目是不良(Bad)),则服务或者角色的状况就是存在隐患(Concerning)。而且系统会对管理员应该采取得到行动提出建议。
  (2)主机监控
      监控集群内所有主机的有关信息,包括主机上目前消耗的内存,主机上运行的角色分配等,不但显示所有集群主机的汇总视图,而且能进一步显示单个主机关键指标详细视图。
  (3)行为监控
      CM提供来列表和图表来查看集群上进行的活动,不仅显示当前正在执行的任务行为,还可以通过仪表盘查看历史活动。
  (4)事件活动
      监控界面可以查看事件,系统管理员可以通过时间范围,服务,主机,关键字等信息过滤事件。
  (5)报警
      通过配置CM可以对指定的时间产生警报,并通过电子邮件或者SNMP的事件得到制定的警报通知。
  (6)日志和报告
      可以轻松点击一个链接查看相关的特定服务的日志条目,并且Cloudera Manager可以将收集的历史日志监控数据统计生成报表。

三.Cloudera Manager提供的诊断功能
  (1)周期性服务诊断
      CM会对集群中运行的服务进行周期性的运行状况测试,以检测这些服务的状态是否正常。如果有异常情况,就会进行告警,有利于更早地让用户感知集群服务存在的问题。
  (2)日志采集及检索
      对于一个大规模的集群,CM提供了日志收集功能,能够通过统一的界面查看集群中每台及其,各项服务的日志,并且能够根据日志级别等不同的条件进行检索。
  (3)系统性能使用报告
      CM能够查看系统性能使用报告,包括集群的CPU使用率,单节点的CPU使用率,单个进程的CPU使用率等各项性能数据,这对于Hadoop集群的性能调试很重要。

四.Cloudera Manager提供的集成功能
  (1)安全配置
      为了方便Hadoop大数据平台与原有身份认证系统如AD,LDAP等的集成,CM只需在界面上配置即可完成。
  (2)Cloudera Manager API
      通过Cloudera Manager API,能够方便地将CM集成到企业原有管理系统集成。
  (3)SNMP集成
      CM也提供了方便的SNMP集成能力,只要简单的配置,就能够将SNMP进行集成,并且将集群中的告警信息进行转发。

Cloudera Manager高级功能

Cloudera Manager的高级功能在免费的Express版本中是不提供的。
  (1)软件升级滚动
      Hadoop版本升级和bug修复,通常会影响业务的连续性。CM提供了滚动升级的功能,支持Hadoop平台进行滚动升级时继续对外提供服务以及应用。
  (2)参数版本控制
      任何时候进行配置修改并保存之后,Cloudera Manager会对该配置生成一个版本。Cloudera Manager支持查看历史配置,并回滚到不同版本,从而为集群恢复,问题诊断等提供了一个可靠的一句和方便的工具。
  (3)备份及容灾系统BDR
      Cloudera为Hadoop平台提供一个集成的,易用的灾备解决方案。BDR为灾备方案提供了丰富的功能,CM和BDR提供了完整的用户画像,实现界面化的数据备份与灾难恢复。
  (4)数据审计
      Cloudera Navigator的审计功能支持对数据的审计和访问。
  (5)安全集成向导
      启用Kerberos集成和外部安全认证集成,如支持通过内部数据库和外部服务进行用户认证。

安装 Cloudera 详情参见: Cloudera安装指南

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: Cloudera Manager是一款用于大数据平台管理工具,它提供了一套集中化的控制台和工具,用于对大数据平台进行运维操作。 Cloudera Manager的主要功能包括集群管理、监控和警报、服务配置和升级、安全性管理等。在使用Cloudera Manager进行大数据平台的运维操作时,可以按照以下步骤进行: 1. 创建集群:在Cloudera Manager控制台中,可以通过向导式界面创建新的集群。在创建过程中需要指定集群的名称、主机节点、角色和服务等。 2. 管理服务:通过Cloudera Manager可以管理各个服务的配置和状态。可以对服务进行启动、停止、重新启动等操作,并进行监控和警报设置。 3. 配置管理Cloudera Manager提供了一套灵活的配置管理系统,可以对各个服务的配置进行修改和管理。可以根据需求对数据节点、NameNode、YARN资源管理器等进行配置优化。 4. 升级管理Cloudera Manager支持集群的升级操作,可以通过控制台进行版本升级,同时提供了预检和回滚功能,确保升级的顺利进行。 5. 安全性管理Cloudera Manager提供了一套完善的安全性管理系统,可以配置SSL加密和认证,管理Kerberos认证和授权,并且支持集成第三方安全工具。 6. 监控和警报:Cloudera Manager可以实时监控集群的状态和性能,并设置警报规则。可以查看CPU、内存、磁盘使用率、任务运行情况等,并及时发送警报邮件或短信。 7. 故障排除:Cloudera Manager提供了故障排除工具和日志管理。可以查看集群和服务的日志,定位和解决故障。 总而言之,Cloudera Manager是一款功能强大的大数据平台运维工具,通过它可以方便地管理和操作大数据平台的各个组件和服务。它提供了一套集中化的管理和监控系统,简化了大数据平台的运维工作,提高了运维效率。 ### 回答2: Cloudera Manager是一个大数据平台的运维工具,它提供了一种简化和自动化管理和监控大数据集群的方法。以下是Cloudera Manager大数据平台运维操作的指南: 1. 安装和配置:首先,需要下载并安装Cloudera Manager。安装完成后,打开Cloudera Manager Web界面,配置一些基本信息,如主机名、端口号和数据库等。 2. 集群管理:接下来,需要添加和管理集群。在Cloudera Manager中,可以通过“添加服务”来选择要安装和配置的各种组件,如Hadoop、Hive、HBase等。然后,将主机添加到集群中,分配相应的角色和服务。 3. 监控和调优:Cloudera Manager提供了强大的监控和调优功能,可以实时监控集群的健康状况和性能指标。可以设置警报,并快速诊断和解决潜在的问题。此外,Cloudera Manager还提供了性能调优建议和自动化调整资源配置的功能。 4. 管理和维护:Cloudera Manager简化了大数据平台管理和维护工作。可以使用Cloudera Manager进行软件升级和补丁管理,以确保集群的安全和稳定性。此外,还可以执行备份和恢复操作,保护数据的安全性。 5. 安全和权限管理Cloudera Manager提供了安全和权限管理功能,可确保集群和数据的安全性。可以配置用户、组和角色,并为不同的用户分配不同的权限。此外,还可以配置加密和防火墙等安全措施。 总之,Cloudera Manager是一个强大而全面的大数据平台运维工具,通过简化和自动化管理和监控任务,帮助管理员提高工作效率,保证集群的高可用性和性能。 ### 回答3: Cloudera Manager是一种用于大数据平台的运维管理工具,通过简化操作和提供全面的监控功能,帮助管理员更轻松地管理和维护大数据集群。以下是Cloudera Manager的运维操作指南: 1. 安装和配置:首先需要安装Cloudera Manager,并按照指引配置相关参数,包括集群规模、节点配置、网络设置等。 2. 群集管理Cloudera Manager提供了一种简便的方式来管理大数据集群。管理员可以通过Cloudera Manager界面添加、删除和管理集群中的节点,实现扩容和缩容的操作。 3. 监控和诊断:Cloudera Manager提供了丰富的监控指标和仪表盘,可以实时监控集群的各个组件和服务的状态。管理员可以通过查看日志和警报来检查并解决潜在的问题。 4. 资源管理Cloudera Manager提供了资源管理和调度功能,可以根据集群的负载情况自动调整资源分配。管理员可以设置资源配额和优先级,确保集群资源的高效利用。 5. 配置管理:通过Cloudera Manager管理员可以集中管理集群中的配置文件和参数。可以方便地修改和应用配置,确保集群的稳定性和一致性。 6. 升级和扩展:Cloudera Manager支持集群的升级和扩展。管理员可以使用升级向导来进行版本升级,并使用扩展向导来添加新的节点和服务。 7. 安全管理Cloudera Manager提供了安全管理功能,可以实现对集群中数据的加密、权限控制和访问控制。管理员可以通过Cloudera Manager来配置和管理安全策略。 通过以上的运维操作指南,管理员可以更好地利用Cloudera Manager管理和维护大数据平台,提高运维效率和系统稳定性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值