Cloudera 从5.2.0升级到最新5.8.2的官方文档翻译

最近把集群升级了,升级同时把官方文档翻译了一下。初始文档整理在pages中,怎么转换过来格式都不太好看,先发图片的吧,格式不太好的文字部分在后面






----------------------------------------------我是格式不好的文字的分割线-----------------------------------------------------------------------





Cloudera升级

tips:如果是基于小版本的升级(5.4.x到5.8.x等),CDH的软件用parcels方式安装,并且启用了HDFS的HA的话,可以用rolling updrade来进行不停机升级。

  1. Cloudera Manager升级(以下简称CM)


升级文档地址:

http://www.cloudera.com/documentation/enterprise/latest/topics/cm_ag_ug_cm5.html


升级内容:

  • 升级数据库schema,匹配最新版本
  • Cloudera Manager Server 和所有支持的服务升级
  • Cloudera Manager agent 升级


升级步骤:

  1. 收集升级信息(有些信息在升级过程中不再可获取,需要提前收集)
  • 主机认证信息(各个主机root账号)
    • 已存
  • 当前CM版本号
    • Version: Cloudera Express 5.2.0 (#60 built by jenkins on 20141012-2239 git: 179000584849e68f98ad2a7fe710723bd6c29c98)
  • 当前CDH版本号
    • CDH 5.0.0, Packages
  • cluster启用的服务
    • HBase
    • HDFS
    • Hive
    • Hue
    • Cloudera Management Service
    • Oozie
    • Spark
    • YARN (MR2 Included)
    • ZooKeeper
  • cluster用parcels还是packages安装的
    • CDH 5.0.0, Packages
  • JDK版本
    • java version "1.7.0_67"
  • 是否打开了Cloudera Navigator的审计
    • 5.4.x以下的版本没有?
  • 用到的database访问信息
    • 已存
  • 操作系统版本号
    • CentOS release 6.5 (Final)
  • cluster是否使用了AES-256加密
    • krb_enc_types


  1. 完成升级之前的部分步骤,包括一些特殊warning提示


  1. 在所有cluster hosts上升级JDK版本(如果需要的话)
  2. 为CM创建一个Package Repository
  • 创建一个临时或者永久的远程资料库,将文件下载进去:
    • http://archive.cloudera.com/cm5/repo-as-tarball/5.8.2/cm5.8.2-centos6.tar.gz
  • 修改本地客户端yum源地址来访问该资料库
  1. 升级CM相关组件
  • Cloudera Navigator 的升级(如果装了的话)
  1. 升级CM Server
    1. 停止CM上所有的service,包括HDFS
    2. 停止CM Server,Database和Agent
  • 停止所有正在运行的commands(TODO)
    • http://www.cloudera.com/documentation/enterprise/latest/topics/cm_dg_view_running_recent_commands.html#cmug_topic_4_7
  • 停止server
    • sudo service cloudera-scm-server stop
  • 停止db(使用内嵌的PostgreSQL时需要)
    • sudo service cloudera-scm-server-db stop
  • 停止agent
    • sudo service cloudera-scm-agent stop
  1. JDK1.6需要升级到1.7以上
  2. 用配置的yum源升级CM
    1. sudo yum clean all
    2. sudo yum upgrade cloudera-manager-server cloudera-manager-daemons cloudera-manager-agent
  3. 如果配置了/etc/cloudera-scm-agent/config.ini这个文件,原文件被添加了后缀,需要重新merge一下。
  4. 验证下当前CM安装版本是否匹配,$ rpm -qa ‘cloudera-manager-*':
  • cloudera-manager-repository-5.8-1.noarch
  • cloudera-manager-server-5.8.0-0.cm580.p0.41.el6.x86_64
  • cloudera-manager-agent-5.8.0-0.cm580.p0.41.el6.x86_64
  • cloudera-manager-daemons-5.8.0-0.cm580.p0.41.el6.x86_64
  1. 开启服务
  • sudo service cloudera-scm-server-db start
  • sudo service cloudera-scm-server start
    1. 登陆CM Admin命令行
    2. 手动或者通过CM来升级集群上各个机器的CM Agent
    3. 向导完成,进入CM首页
    4. 其他服务重新start
    5. 升级JDK的话需要操作的步骤
  1. 验证和测试升级结果
  • 用 Inspect Hosts in Cluster 来检测
  1. 升级相关的Cloudera Navigator组件
  2. 升级CDHCDH升级(如果之前大版本是CDH5,不论之前是用parcels还是packages安装的,CDH都建议升级时使用parcels)
  3. 升级之前
  • 阅读CDH 5版本日志
  • 阅读CM 5的版本日志
  • 确保JDK1.7或1.8已安装
  • 如果使用了kafka,需要:
  • 确保CM的minor version等于或者大于CDH的minor version
    • CM 5.0.X —》CDH 5.0.5 
    • CM 5.1.X —》CDH 5.1.4
  • 从CDH5.2开始(Hive version 13),Hive支持日期格式的分区列。如果从老版本升级上来的数据在日期格式的分区列中存在错误数据的话,则升级后该条数据既不能被使用也不能被丢弃,为避免此类情况,请做如下操作:
    • Fix any invalid dates before you upgrade. Hive expects dates in partition columns to be in the form YYYY-MM-DD.
    • Store dates in partition columns as strings or integers.
    • 可使用查询SQL查找是否有此类DDL:
      • http://www.cloudera.com/documentation/enterprise/latest/topics/install_upgrade_to_cdh58.html#xd_583c10bfdbd326ba-590cb1d1-149e9ca9886--7a4e 
    • 若升级Impala时,略
    • 运行 Host Inspector,修复所有问题
    • 如果用了security,则运行Security Inspector
    • Run hdfs fsck / and hdfs dfsadmin -report and fix every issue.
    • Run hbase hbck.
    • 为避免一些提醒,可在升级期间开启maintenance mode
    • Hue应用CA验证和需要一个受信的存储,为Hue配置TLS/SSL:
  1. 升级不由CDH管理的组件
  2. 停止集群各个服务
  3. 备份NameNode上的HDFS Metadata
    1. HDFS的配置页面查找NameNode Data Directories配置项的值
    2. 如果多于一个目录,则每个目录创建一个备份

# cd /data/dfs/nn

# tar -cvf /root/nn_backup_data.tar .

  1. 备份Hive的Metadata Database
  • 如果之前升级CM的时候没备份的话
  1. 升级CM管理的组件
  • 之前配置的yum源,yum update
  1. 重启agent来更新版本链接
  • service cloudera-scm-agent restart
  1. 运行CM升级向导
  • http://www.cloudera.com/documentation/enterprise/latest/topics/install_upgrade_to_cdh58_packages.html#xd_583c10bfdbd326ba-590cb1d1-149e9ca9886--7a4c__section_acf_1cx_jq
  1. 手工处理升级失败的步骤
  2. 最终化HDFS的Metadata的升级
  3. 升级向导的操作
    1. 升级HDFS Metadata
    2. 升级Hive Metadata Database
    3. 升级Oozie ShareLib
    4. 升级Sqoop
    5. 升级Sentry Database
    6. 升级Spark
    7. 开启集群所有服务直到全部健康成功start
    8. Deploy Client Configuration









升级完成


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值