CDH6官方文档中文系列(4)----Cloudera安装指南(安装Navigator Data Management)

Cloudera安装指南

最近在学习cdh6的官方文档,网上也比较难找到中文的文档。
其实官方英文文档的阅读难度其实并不是很高,所以在这里在学习官方文档的过程中,把它翻译成中文,在翻译的过程中加深学习了解,并分享出来和大家一起学习。
中文内容是本人的渣渣英文水平结合有道词典,谷歌翻译的结果,文中部分词语可能翻译的并不准确,希望大家多多提出意见,共同进步。
cdh6的官方中文文档系列长期更新,最后目标整理成gitbook,同大家交流学习。
最后,如果你觉得本文对你有用,希望点个赞给作者一点鼓励哈。

与其感慨路难行不如马上上路,诸位道友,共同学习,加油!-------天南第一剑修

官方文档

本指南提供了在生产环境中安装Cloudera软件(包括Cloudera Manager、CDH和其他托管服务)的指导。

对于非生产环境(例如测试和概念验证用例),请参阅概念验证安装指南,了解简化的(但有限的)安装过程。

本指南包括以下部分:

安装Navigator Data Management

Cloudera Navigator数据管理组件在两个不同的角色中实现——Navigator审计服务器和Navigator元数据服务器,它们运行在Cloudera管理服务上。这些角色可以在初始安装Cloudera Manager时添加,也可以稍后添加到现有的Cloudera Manager集群中。

重要提示:Cloudera Navigator数据管理需要Cloudera企业许可证。Cloudera Express没有这个功能。有关详细信息,请参见管理许可证

本页中的步骤是安装Cloudera导航器作为新的Cloudera Manager集群安装的一部分,以及将服务添加到现有集群。有关升级现有部署的信息,请参见升级Cloudera Manager

注意:有关兼容的Cloudera导航器和Cloudera管理器版本的信息,请参阅Cloudera导航器的产品兼容性矩阵

建议的最小内存和磁盘空间

ResourceNavigator Audit ServerNavigator Metadata Server
Memory不固定, 但是要求不少于Navigator Metadata Server40 GB total
Java heap size2 – 3 GB10–20 GB (initial setup)
OS buffer cache20 GB20 GB (initial setup). Increase by 20-GB increments over time as needed.
Disk数百GB。取决于集群大小和生成的审计卷。200 GB (建议SSD)
Default pathNone. 本地的 Cloudera Navigator 数据库./var/lib/cloudera-scm-navigator

Navigator Metadata Server 和Navigator Audit Server有不同的推荐配置,您在计划部署时应该考虑这些配置。初次安装时,请注意以下事项:

  • Navigator审计服务器内存和磁盘需求——对于Navigator审计服务器,2-3 GB (GB)的Java堆大小通常就足够了(内存通常不会产生任何问题)。对于Navigator Audit Server,数据库配置会影响性能,因此必须正确配置。由于Navigator审计服务器可能需要每天推送数百万行审计数据(取决于集群大小、服务数量和其他因素),Cloudera建议:

    • 将数据库设置在与Navigator审计服务器相同的主机上,以最小化延迟。
    • 监视数据库工作负载并根据需要进行调优。
  • Navigator Metadata Server Memory and Disk Requirements内存和磁盘需求——Navigator 元数据服务器的搜索功能依赖于嵌入式Solr实例。Solr索引在本地保存到主机的硬盘驱动器,通常只消耗几十gb的磁盘空间,因此为数据分配~200 gb通常就足够了。对于导航元数据服务器磁盘,Cloudera建议:

    • 在Solr索引所在的主机上挂载SSD驱动器,以获得最快的I/O。

    • 一旦系统启动并运行,请使用清除功能,以保持检查该位置的硬盘驱动器的消耗。

    导航元数据服务器可能出现的瓶颈通常与I/O内存(而不是CPU)相关。内存包括可用于操作系统缓冲区缓存设置的Java堆大小和可用RAM。对于导航元数据服务器RAM, Cloudera建议:

    • 将Java堆大小设置为10-20 GB,这对于初始设置来说已经足够了。

    • 根据集群活动的需要,将操作系统缓冲区缓存增加20 GB以提高性能。

有关更多信息,请参见Navigator元数据服务器调优

为Cloudera Navigator配置数据库

在安装Cloudera Navigator过程中,必须选择一个数据库来存储审计事件和策略、角色和审计报告元数据。您可以选择嵌入式PostgreSQL数据库,也可以选择外部数据库,如Oracle或MySQL(参见其他数据库系统的数据库需求)。

对于生产环境,Cloudera建议使用外部数据库而不是嵌入式PostgreSQL数据库。此外,在开始安装过程之前,必须设置并运行数据库。有关更多信息,请参见步骤4:安装和配置数据库

在Cloudera Manager安装过程中添加Cloudera Navigator 角色

Cloudera管理器要求角色:完全管理员

  1. 安装Cloudera管理器,详见安装指南

  2. 在Cloudera Manager安装向导的第一页,选择一个支持Cloudera导航器的许可选项:

    • 数据科学与工程版

    • 操作数据库版本

    • 数据库版本

    • 企业数据中心版

  3. 上传许可:

    • 点击上传许可证

    • 单击“选择许可文件文本字段”左边的文档图标。

    • 转到许可文件的位置,单击该文件,然后单击Open

    • 点击上传

  4. 单击Continue继续安装。

  5. Add Services过程的第一页,单击Include Cloudera Navigator复选框。

  6. 要使用外部数据库,请在数据库设置页面中输入Cloudera Navigator审计服务器和元数据服务器数据库属性。

向现有的Cloudera管理器集群添加Cloudera导航器数据管理角色

如果Cloudera Manager集群有足够的资源,您可以随时向集群添加任何一个Cloudera导航器角色的实例。有关更多信息,请参阅:

Cloudera导航器数据管理文档

下表列出了与配置、升级、管理和使用Cloudera Navigator数据管理组件相关的其他主题。

FAQCloudera Navigator常见问题回答有关Cloudera Navigator数据管理组件以及它如何与其他Cloudera产品和集群组件交互的常见问题。
IntroductionCloudera Navigator Data Management Overview为数据专员、治理和遵从性团队、数据工程师和管理员提供概述。包括Cloudera导航器的入门,对Cloudera导航器控制台(UI)和Cloudera导航器api的概述。
User GuideCloudera导航器数据管理指南向数据专员、法规遵循官员和其他业务用户展示如何使用Cloudera导航器执行数据治理、法规遵循、数据管理和其他任务。主题包括审计元数据传承图Cloudera导航器和云服务和安全管理等等。
Upgrade升级Cloudera管理器(Cloudera导航器与Cloudera管理器一起升级)。
SecurityConfiguring Authentication for Cloudera Navigator
Configuring TLS/SSL for Navigator Audit Server
Configuring TLS/SSL for Navigator Metadata Server
Release NotesCloudera Navigator Data Management Release Notes
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
CDH是Apache Hadoop和相关项目的最完整,经过测试的流行发行版。 CDH提供了Hadoop的核心元素 - 可扩展的存储和分布式计算 - 以及基于Web的用户界面和重要的企业功能。 CDH是Apache许可的开放源码,是唯一提供统一批处理,交互式SQL和交互式搜索以及基于角色的访问控制的Hadoop解决方案。 Cloudera作为一个强大的商业版数据中心管理工具,提供了各种能够快速稳定运行的数据计算框架,如Apache Spark;使用Apache Impala做为对HDFS,HBase的高性能SQL查询引擎;也带了Hive数据仓库工具帮助用户分析数据; 用户也能用Cloudera管理安装HBase分布式列式NoSQL数据库;Cloudera还包含了原生的Hadoop搜索引擎以及Cloudera Navigator Optimizer去对Hadoop上的计算任务进行一个可视化的协调优化,提高运行效率;同时Cloudera中提供的各种组件能让用户在一个可视化的UI界面中方便地管理,配置和监控Hadoop以及其它所有相关组件,并有一定的容错容灾处理;Cloudera作为一个广泛使用的商业版数据中心管理工具更是对数据的安全决不妥协! CDH 提供: 灵活性 - 存储任何类型的数据,并使用各种不同的计算框架进行处理,包括批处理,交互式SQL,自由文本搜索,机器学习和统计计算。 集成 - 在一个可与广泛的硬件和软件解决方案配合使用的完整Hadoop平台上快速启动并运行。 安全 - 过程和控制敏感数据。 可扩展性 - 启用广泛的应用程序并进行扩展和扩展,以满足您的需求。 高可用性 - 充满信心地执行关键业务任务。 兼容性 - 利用您现有的IT基础设施和资源。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值