天翼云认证运维工程师重点知识点串讲
一、天翼云运维概述
必备掌握知识点:
- 运维的概念:运维,本质上是对网络、服务器、服务生命周期的各个阶段,进行运营与维 护,在成本、稳定性、效率上达成一致可接受的状态。而运维工程师的职责是负责维护并确保整个服务的高可用性,同时不断优化系统架构,提升部署效率、优化资源利用率。
- 目前比较流行的几种部署方案:蓝绿部署、滚动发布、灰度发布/金丝雀发布。
- 蓝绿部署的缺点:
- 资源消耗是正常业务的两倍以上,防止升级期间无法承载业务突发。
- 短时间内浪费一定资源成本。
- 基础设施无改动,增大升级稳定性。
- 滚动发布的缺点:
- 部署时间慢,取决于每阶段更新时间。
- 发布策略较复杂。
- 不易回滚。
- 灰度发布的好处:
- 保证整体系统的稳定性,在初始灰度的时候就可以发现、调整问题,影响范围可控。
- 新功能逐步评估性能,稳定性和健康状况,如果出现问题,影响范围会很小。
- 用户无感知,平滑过渡。
- 天翼云提供的云监控服务产品有哪些功能:
云监控服务面向云主机、云硬盘、RDS等产品提供监控服务,实现性能指标监控、自动告警、 历史信息查询等功能。借助云监控服务,用户可以更详细的了解云资源使用情况,方便用户及时调整。
- 运维监控工程行业使用的运维监控工具有:Cacti、Nagios、Zabbix
- Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具。简单的 说Cacti就是一个PHP程序。它通过使用SNMP协议获取远端网络设备和相关信息,(其实就是使用Net-SNMP软件包的snmpget和snmpwalk命令获取)并通过RRDTOOL工具绘图,通过PHP程序 展现出来。我们使用它可以展现出监控对象一段时间内的状态,或者性能趋势图。
- Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,
交换机路由器等网络设置。在系统或服务状态异常时,发出邮件或短信报警,第一时间通知 网站运维人员,在状态恢复后发出正常的邮件或短信通知。nagios主要的特征是监控告警, 最强大的就是告警功能,可支持多种告警方式,但缺点是没有强大的数据收集机制,并且数 据出图也很简陋,当监控的主机越来越多时,添加主机也非常麻烦,配置文件都是基于文本 配置的,不支持web方式管理和配置,这样很容易出错,不宜维护。
- zabbix是一个基于WEB界面提供分布式系统监视,以及网络监视功能的企业级开源解决 方案。zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供强大的通知机制, 让系统运维人员快速定位,解决存在的各种问题。zabbix由2部分构成,zabbix server与可
选组件zabbix agent。zabbix server可以通过SNMP、zabbix agent、ping、端口监视等方法, 提供对远程服务器和网络状态的监视,还有数据收集等功能,它可以运行在Linux, Solaris, HP-UX, AIX, Free BSD等平台上。
- 实名认证规则
实名认证分个人用户实名认证和企业用户实名认证。实名认证需要拍摄身份证及活体认证, 推荐在天翼云APP完成。
- API简介
OOS 提供了基于 Web 门户和基于 HTTP REST 接口两种访问方式,用户可以在任何地方通过互联网对数据进行管理和访问。OOS 提供的 REST 接口与 Amazon S3 兼容,因此基于 OOS 的业务可以非常轻松的与 Amazon S3 对接。
- 云API产品优势
- 云API提供多语言SDK,方便开发者访问API。针对移动、物联网场景,还提供集成加速 优化方案的SDK。
- 简单配置即可快速提供API,少量代码即可轻松使用API。
- 私有加密协议,传输内容更精简,使用更安全。
- 完善的监控报警功能让您无忧管理API。
二、云服务器运维
必备掌握知识点:
- 天翼云弹性云主机定义:
弹性云主机(CT-ECS,Elastic Cloud Server)属于天翼云弹性计算服务,由CPU、内存、云镜像、云硬盘组成,是一种可随时获取、即开即用、弹性可扩展的计算服务器,同时它结合VPC、安全组、数据多副本保存等能力,打造一个高效、可靠、安全的计算环境,确保服务持 久稳定运行。
- 天翼云产品优势:
快速开通、多层次安全防护、灵活的资源变更方式、便捷管理、灵活计费
- 退订弹性云主机后,弹性伸缩服务也随之暂停服务。
- 弹性云主机关机后弹性伸缩服务不会暂停服务。
- 天翼云弹性云主机计费模式分为:包月计费模式、按需计费模式。 按需计费模式,收费方式
- 预存后付费方式:提前充值现金到天翼云账户中,现金账户余额不低于100元,之后系统 按照用户实际使用量进行结算。
- 计费周期:按小时计费,以自然小时为计费单位(均以北京时间为准),不满一小时按 照一小时计费。费用从用户账户现金余额中扣费。开通时间建议整点开通,开通不足一 个自然小时,按一小时收费。提前删除也按照自然小时收费。
- 弹性云主机支持规格的变更,主要包括?CPU的增加或减少、内存的增加或减少、存储资源 的增加或减少。
- 使用天翼云产品服务,可以创建10个弹性伸缩组,100个弹性伸缩配置。
- 同一云硬盘只能选择一种计费方式,无法同时选择。
- 余额不足的时候会把我的云硬盘会不会被删除?数据怎么办?
回答:从用户发生欠费时算起,云硬盘遵循欠费提醒及通知规则,但不影响正常使用, 欠费7天后会被删除回收,云硬盘删除后用户数据不可恢复。
- 故障一:重启/关机弹性云主机时,长时间处于“正在重启”/“正在关机”状态,怎 么办?
如果对弹性云主机执行重启/关机操作,弹性云主机长时间(大于30分钟)处于“正在重 启”
/“正在关机”状态时,建议执行强制重启/强制关机操作。
-
- 登录控制中心。
- 选择“计算 > 弹性云主机”。
- 勾选待强制重启/强制关机的弹性云主机,并单击“重启”/“关机”。
- 系统弹窗提示用户是否要对弹性云主机进行重启/关机操作。
- 勾选“强制重启”/“强制关机”,确定强制重启/强制关机弹性云主机。
- 单击“确定”。
- 故障二:物理机故障时,弹性云主机是否会自动恢复?
会,弹性云主机运行在物理机上,虽然天翼云提供了多种机制来保证系统的可靠性、容错能力 和高可用性,但是服务器的硬件、电源等部件仍有较小概率的损坏。如果物理设备的损坏导致 物理机电源无法正常工作或重启,会导致CPU和内存数据丢失,无法进行热迁移来恢复弹性云主机。
天翼云默认提供了自动恢复功能,以冷迁移的方式重启弹性云主机,使弹性云主机具备高可靠 性和强大的动态迁移能力。当弹性云主机所在的硬件出现故障时,系统会自动将弹性云主机迁 移至正常的物理机,保障您受到的影响最小,该过程会导致云主机重启。
说明:
-
- 自动恢复功能不保证用户数据的一致性。
- 仅支持物理主机故障产生的弹性云主机自动恢复,弹性云主机本身故障当前不支持自动 恢复。
- 对于同一弹性云主机,如果发生物理主机故障,12小时内仅允许1次自动恢复操作。
- 如下场景时,可能会引起自动恢复弹性云主机失败:
- 系统发生大规模故障,导致迁移弹性云主机前,找不到可用的物理主机。
- 迁移弹性云主机时,用于迁移的物理主机临时容量不足。
- 故障三:无法导入密钥对,怎么办?
当您的浏览器是IE9时,可能无法导入密钥对或无法使用文件注入功能,请参考如下步骤修改 浏览器默认属性后重试。
-
- 在浏览器主界面,单击设置 。
- 选择“Internet选项”。
- 单击选择“安全”页签。
- 单击“Internet”。
- 如果安全级别显示为“自定义”,单击“默认级别”按钮,把设置还原为默认级别。
- 滑动安全级别滑块,把安全级别调到“中”级别,单击“应用”按钮。
- 选择“自定义级别”。
- 将“对未标记为可安全执行脚本的ActiveX控件初始化并执行脚本”设置为“提示”。
- 单击“确定”。
- 故障四:为什么使用密钥文件无法正常登录Linux弹性云主机?
问题描述:用户使用创建弹性云主机时,使用的密钥文件登录Linux弹性云主机登录失败。 根据Linux弹性云主机使用的镜像不同,可能会存在如下原因:
-
- Linux弹性云主机的镜像为用户自己制作的私有镜像,且在创建该私有镜像时用户未安装Cloud-init工具。
- Linux弹性云主机的镜像安装了Cloud-init工具,但是在创建弹性云主机时,获取密钥失 败。
处理方法: 针对原因1:
创建私有镜像时不安装Cloud-init工具,将无法对弹性云主机进行自定义配置,此时,用户只
能使用镜像原有密码或密钥登录弹性云主机。
其中,镜像原有密码或密钥只创建私有镜像时,用户自己设置的操作系统密码或密钥。如果忘 记镜像原有密码,或镜像原有密钥丢失,可以通过弹性云主机页面提供的“重置密码”功能, 自助完成弹性云主机的密码重置。
针对原因2:
-
-
- 勾选待获取密码的弹性云主机,单击“重启”,重新启动弹性云主机。
- 重启成功后,再次使用密钥文件登录弹性云主机,确认是否能够正常登录。 如果能正常登录,问题解决;不能正常登录,请联系客服。
-
- 故障五:密钥对无法下载
问题分析:密钥对私钥文件只能下载一次。
如果密钥对私钥文件已丢失,建议您重新创建并下载保存。 处理方法(实操):登录云主机控制台,选择“密钥对”。
- 故障六:找不到已购买的弹性云主机?
- 请确认自己购买的弹性云主机所属区域。
说明:当前天翼云节点覆盖国内20多个省份,如北京、上海、广东、浙江、贵州等。
-
- 查看对应区域的弹性云主机,操作步骤如下:
- 登录天翼云官网,单击右上角的“控制台”。
- 单击区域选择框,选择购买服务器的区域。
- 进入“选择区域”页面,选择“弹性云主机”,查看帐号下的弹性云主机。
- 查看对应区域的弹性云主机,操作步骤如下:
- 故障七:用户创建弹性云主机成功后远程登录提示密码错误。 处理方法:
通过检查弹性云主机的网络配置,是否导致弹性云主机cloudinit失败,检查步骤如下:
- 弹性云主机所在安全组80端口“出方向”和“入方向”是否放通。
- 弹性云主机所在子网DHCP是否放通。
说明:弹性云主机所在的安全组80端口、弹性云主机子网DHCP放通后,重启弹性云主机,等待 3~5分钟,远程登录输入密码或密钥可以登录。
- 容器是一种轻量级、可移植、自包含的软件打包技术,使应用程序可在几乎任何地方 以相同的方式运行。
- 开发人员在计算机上创建并测试好的容器,无需任何修改就能在生产系统虚拟机、物 理服务器或公有云主机上运行,而Docker是Go语言编写的容器技术。
- 云硬盘产品优势:
- 高可靠
云硬盘采用分布式存储,每份数据在后台保存多份副本,多副本数据实时同步,不会因存储掉 电、故障导致用户数据丢失,保证数据安全可靠。数据存储的持久性可达99.99995%。
-
- 低延迟、高性能
贵州节点单磁盘支持的最大随机IOPS可达20000、吞吐量可达350MBps、网络延时仅为2ms,满 足不同业务场景的需求。
-
- 大容量
提供超大容量云硬盘,数据盘最大可支持32T,每台云主机最多可挂载60块SCSI云硬盘,满足 业务对高容量存储的需求。
-
- 弹性扩展
既支持通过单台云主机上挂载多块云硬盘的方式扩展存储空间,还可支持对单块云硬盘进行扩 容。
- 反亲和性和SCSI锁的相关概念:
- 云主机组的反亲和性:ECS在创建时,将会分散地创建在不同的物理主机上,从而提高业 务的可靠性。您只能在创建ECS的时候选择虚拟机组,对于现有的ECS,不支持添加云主机组的操作。