云计算-使用、质量和成本指标(Usage, Quality and Cost Metrics)

业务成本指标 (Business Cost Metrics)

        云服务对云消费者的主要好处之一是可以降低消费者的成本。在本节中,我们将研究与内部IT资源相比,使用云服务时可以改进的许多成本指标。在我们审查这些成本时,你应该记住某些成本指标对于云资源而言会更低,但某些成本指标可能会更高。在做出最终决定之前,应比较所有成本的总和以及其他非成本指标。

前期和持续成本

        前期成本是指建立IT资源所涉及的成本。这些成本包括硬件、软件和所需的人员。这些包括:

  • 内部IT资源 – 购买硬件、购买软件、安装硬件所需的环境、部署(安装)IT资源所需的劳动力。
  • 基于云的IT资源 – 评估和配置云资源所需的劳动力、网络建立成本。

        通常,云资源的前期成本远低于内部成本。我们还必须考虑到云资源通常是租赁的,这意味着资源可以在消费者的租赁期结束时转移到另一个提供商或放弃。对于云资源,这意味着重新部署或退役系统所需的劳动力,而对于内部IT资源,这还需要处理现有资源的处置。

        持续成本是运行IT服务的成本。这些包括:

  • 内部 – 硬件操作(电力、许可费、保险和劳动力)、服务和操作劳动力。
  • 基于云的 – 服务操作劳动力、云提供商费用、网络带宽成本。

        通常,基于云的IT资源的持续成本至少等于但通常高于内部IT资源。尽管云提供商可以更高效地购买和操作硬件和软件,但还需要考虑额外的网络成本和利润率。

其他业务成本

        在选择内部资源和云资源之间时,还必须考虑其他一些成本。尽管这不是一个业务单位,但如果你参与云决策,你需要了解这些成本。

  • 资本成本 – 这是获取资金投资于业务的成本。这包括贷款成本、引入新业务伙伴的成本(因此降低现有的所有权份额),以及任何其他方式筹集所需资金的成本。显然,建立云资源的成本远低于建立内部IT资源。例如,考虑一家澳大利亚服务公司希望扩展到海外市场。他们可以在海外建立自己的场所,也可以在新市场租赁云资源。在每个市场建立计算机中心的成本需要大量的前期成本,而现有资源可能无法承受,即没有银行会借钱给他们,股东也不愿意提供更多资金。

  • 沉没成本 – 这是已经花费的钱。对于IT资源,企业可能已经在硬件、软件和人员上进行了大量投资,因此如果新的IT资源可以利用当前系统的一部分或全部,那么前期成本会较小。如果新系统在同一硬件上替换旧系统,这一点尤其如此。

  • 集成成本 – 这是使新IT资源与当前业务资源协同工作的成本。这些成本可能包括测试、数据转换、修改现有系统和其他费用。这些成本可能使提供内部资源的成本较低。

  • 锁定成本 – 随着时间的推移,企业可能会被“锁定”到一个云提供商。这可能是因为云提供商的独特非标准系统。这引入了云提供商可能增加成本或破产的风险,使消费者处于困难境地。企业在未来决定更改安排时,必须考虑迁移到另一个提供商或内部资源的成本。

活动1:业务成本指标

        问题:内部部署和云租赁设置相关的最显著成本是什么?请参见链接:CloudZero

        回答:内部部署设置的显著成本包括硬件和软件的采购、安装硬件的环境和部署所需的劳动力。云租赁设置的显著成本包括评估和配置云资源的劳动力以及网络建立成本。前期成本通常对云资源来说较低,但持续成本可能相等或更高,因为需要考虑云提供商费用和网络带宽成本。

        请阅读这篇文章,了解为什么与数据相关的成本被认为是云计算的主要成本之一:ComputerWorld

        问题:为什么与数据相关的成本被认为是云计算的主要成本之一?

        回答:与数据相关的成本是云计算的主要成本之一,因为云计算环境中的数据存储和传输涉及高昂的费用。存储成本通常基于数据量和使用时间,而高性能服务可能还会收取I/O流量的费用。此外,数据传输费用包括入站和出站流量的成本,这在大规模使用时会迅速增加。

云使用指标 (Cloud Usage Metrics)

        下述阅读将云使用指标分为四种类型:网络、服务器、存储设备和云服务。我们现在来看每一种以及不同的测量方法。

网络使用

        通常有三种类型的网络使用指标,云提供商可能会根据这些指标收费。并非所有云提供商都对每一种指标收费。入站网络和云内网络流量可能是免费的。在这种情况下,其他成本会更高以覆盖提供商的成本。

        这三种类型是:

  • 入站网络使用 – 通常以字节为单位测量,并可以应用于IaaS、PaaS和SaaS环境。
  • 出站网络流量 – 也以字节为单位测量,并应用于IaaS、PaaS和SaaS环境。
  • 云内网络流量 – 这是云提供商数据中心之间的网络流量(以字节为单位)。此流量用于数据同步、备份和故障切换处理。

        提供商可能还会对静态IP地址、网络负载平衡和虚拟防火墙收费。通常不会对数据中心内的LAN网络流量收费。

服务器使用

        IaaS和PaaS环境通常有服务器使用费用。这些费用根据虚拟服务器的数量、虚拟服务器的配置和消费者使用的硬化环境的数量来收费。

        下述阅读识别了服务器使用收费的两种方式:

  • 按需虚拟机实例 – 根据虚拟机实例的正常运行时间收费,不包括虚拟机暂停的时间。
  • 预留虚拟机实例 – 根据虚拟机预留的时间长度收费。

        在计算虚拟服务器使用时,不同的服务器配置会有不同的费率。例如,虚拟CPU的数量和速度以及可用内存量会有不同的费用。

存储设备使用

        云存储通常根据占用的存储量和使用时间收费。然而,对于高性能服务,可能还会对I/O流量收费。这种收费逻辑源于之前讨论的存储设备负载平衡架构,这些架构将数据移动到SSD等高速设备,以允许高负载服务保持响应速度。

        下述阅读将云服务设备使用分为两种类型:

  • 按需存储空间分配 – 测量分配的存储空间大小和持续时间。可以应用于IaaS、PaaS和SaaS模型。
  • I/O数据传输 – 从/向存储设备的数据传输量。通常应用于IaaS和PaaS环境。并非所有云提供商都对I/O数据传输收费。
云服务使用

        云服务使用适用于SaaS环境。下述阅读识别了三种云服务收费方式:

  • 应用订阅持续时间 – 这是单个用户订阅服务的时间长度。典型的订阅周期为每日、每月或每年。
  • 用户数量 – 这是在给定时间段(通常为每月或每年)订阅的用户数量。
  • 交易数量 – 这是服务为用户处理的交易数量。交易通常是请求/响应交互。
活动2:云使用成本指标

        请阅读这篇关于成本指标的文章,识别你认为最重要的三个成本指标:Gitnux

        问题:从你的角度来看,最重要的三个成本指标是什么?

        回答:从我的角度来看,最重要的三个成本指标是:

  1. 数据传输成本 – 由于云计算环境中的数据传输涉及高额费用,特别是对于大规模数据传输。
  2. 存储成本 – 云存储根据占用的存储量和使用时间收费,是主要成本之一。
  3. 计算资源使用成本 – 包括虚拟机实例的运行时间和配置,会显著影响总成本。

        获取“亚太地区”使用Linux操作系统和内存优化配置(10个vCPU)的EC2实例的价格估算。请使用此链接:AWS EC2 Pricing

        问题:获取具有MSQ兼容性和中型实例大小的RDS Aurora在亚太地区的价格估算:AWS Aurora Pricing

        问题:在悉尼(澳大利亚)运行Linux的EC2 t3.small虚拟服务器(2个虚拟CPU和2GB内存)每月的成本是多少?如何预留相同的t3.small虚拟实例?请注意,没有明确的一个月预留选项,请选择允许一个月后退出的选项。

        回答:根据AWS定价页面,运行Linux的EC2 t3.small实例在悉尼每月的成本为18.24美元。如果选择预留实例,按一年期预留的费用为13.45美元/月。详细定价和选项请参见AWS定价页面。

Amazon AWS还提供spot实例和dedicated hosts。请解释这些是什么。

        回答

  • Spot实例 – 是AWS提供的空闲计算能力,价格较低,但可能会随时被终止,适用于非关键性和弹性的工作负载。
  • Dedicated hosts – 提供专用物理服务器,允许用户使用其现有的服务器绑定软件许可证,更好地控制硬件和满足合规性要求。

成本管理考虑 (Cost Management Considerations)

        成本管理适用于云服务生命周期的各个阶段。云服务生命周期类似于软件开发生命周期,但在云环境中增加了设计、选择、定价和操作的阶段。下述阅读识别了七个阶段:

  • 云服务设计和开发 – 服务提供商定义并分发标准成本信息。
  • 云服务部署 – 在部署期间或之前实施测量和计费的架构。
  • 云服务合同 – 这是消费者与提供商之间的价格谈判。
  • 云服务提供 – 这是服务所有者向云消费者提供的定价。可以是标准定价和选项定价。
  • 云服务配置 – 这是云提供商或云消费者对实例创建和实例使用设置的限制。对这些选项限制的规范将有助于控制成本,但可能会影响服务质量。
  • 云服务运营 – 这是服务使用的监控和使用数据的生产,以便向消费者开具账单。
  • 云服务退役 – 这是云服务被停用的时候。历史成本数据可能会被存档以供将来分析。

        成本管理系统可以由云消费者和云提供商在云服务生命周期的任何阶段实施。

        云提供商使用的定价模型必须考虑各种因素。定价模型通常以模板的形式呈现,列出我们在上一节中讨论的所有组件定价。提供模板对于消费者来说很重要,这样他们可以比较不同提供商的定价模型。

        个别组件的实际价格可能取决于各种因素,包括:

  • 提供组件的成本
  • 与其他提供商的市场竞争
  • 监管和其他政府要求
  • 提供商在设计、部署和操作IT资源方面的成本
  • 提供商是否可以使用资源共享来提供服务

        此外,对于同一服务,可能会有多个价格模板。

  • 不同的成本指标,例如按需资源与预留资源
  • 固定和可变费率 – 分配给用户的资源与资源使用定价
  • 大宗折扣 – 高容量消费者通常会提供折扣
  • 付款选项 – 例如,预留一年比多次每周预订便宜。提前付款可能会获得折扣。

        在以下阅读中,你会看到还有其他定价考虑因素。如果你是大客户,通常可以与提供商协商定价。与正常业务一样,如果你是一个良好的客户并按时付款,甚至提前付款,你可能能够协商更好的价格。你还应该能够利用历史使用数据进行谈判,提供商也可以利用这些数据来设定价格。

活动3:成本管理考虑

        阅读这篇文章并比较所提到的成本管理策略:VMware

        问题:你是否同意这里提到的成本管理机制?IBM

        回答:是的,我同意这些成本管理机制。成本透明度、优化和治理是有效管理云成本的关键。通过实施预算控制、持续监控和优化资源使用,可以显著降低总体成本。

服务质量指标的属性 (Attributes of the Service Quality Metrics)

        如前所述,云消费者在与云提供商签订合同时会接受服务级别协议(SLA)。在讨论机制和架构时,我们已经提到了一些可能包含在SLA中的服务质量指标。这些指标和保证、特性、限制统称为服务质量(QoS)。在这里,我们将更详细地讨论这些内容。

        “指标”这个词意味着它所应用的东西是可测量的。这意味着消费者和提供商可以收集与指标匹配的数据,从而可以决定提供商是否达到了约定的QoS属性。服务的可测量属性示例如下:

  • 可用性:服务正常运行的时间。
  • 可靠性:故障或错误之间的时间。
  • 性能:响应时间、吞吐量等。
  • 可扩展性:根据服务需求进行向上和向下扩展的能力。
  • 弹性:故障后成功的故障切换和服务恢复。

        如前所述,云提供商可以实施SLA监控器,收集上述QoS属性的统计信息。云消费者可以实施自己的统计信息收集系统,并可以通过帮助票据或消费者组织中的其他系统观察用户的投诉。

        重要的是,提供商和消费者都信任这些指标。这不仅是为了分配SLA问题的责任,也是为了隔离性能问题并在消费者和提供商之间建立信任。这意味着服务质量指标应该是:

  • 可量化的:数据测量以易于理解的单位清晰表达。
  • 可重复的:特定事件的测量应始终返回相同的值。
  • 可比的:用于比较的不同方面应使用相同的计量单位。SLA中提到的单位应与实际测量的单位一致。
  • 可获取的:云消费者必须能够获取并理解所选择的指标数据。

        下述阅读识别了一些常见的云服务指标。我们现在将总结每一个指标。

服务质量指标
可用性指标
  • 可用率 – 资源对消费者可用的时间百分比。例如,SLA中可能会引用99.9%的正常运行时间。
  • 停机时间 – 最大和平均停机时间。例如,SLA中可能会指定最大停机时间为10分钟,平均为3分钟。
服务可靠性
  • 平均故障间隔时间(MTBF) – 服务故障之间的平均时间。例如,SLA中可能会声明MTBF为30天。
  • 可靠性率 – 成功的SaaS交易发生的速率。注意,故障可能由于许多内部原因发生,例如在指定的IT资源最大扩展时超载。例如,SaaS服务可能在SLA中指定99.9%的可靠性率。
服务性能
  • 网络容量 – 以可测量单位表示的网络带宽/吞吐量。例如,SLA中可能会指定网络容量为100mbps(约10MB/s)。
  • 存储设备容量 – 存储设备(虚拟或物理)的容量。例如,SLA中可能会指定100GB的存储容量。
  • 服务器容量 – 服务器的虚拟配置。例如,服务器可能被测量为2个vCPU、3GB内存、2.00GHz时钟速度和30GB二级存储。
  • Web应用程序容量 – 基于Web的SaaS服务的可测量特性。例如,SaaS SLA可能指定最大每秒100个请求。
  • 实例启动时间 – 从二级存储加载虚拟服务器或加载新服务器模板的时间。例如,云提供商可能会指定加载服务器实例的最大时间为3分钟,平均时间为2分钟。
  • 响应时间 – 处理SaaS请求并在特定时间段内响应的平均时间。例如,SaaS SLA可能会指定响应时间为10毫秒。必须清楚理解测量的位置,如果在虚拟服务器上测量,则不包括网络响应时间。
  • 完成时间 – 完成某些后台任务的平均时间(通常在PaaS或SaaS服务中)。例如,SLA可能会指定批处理报告任务的最大完成时间为5分钟。
服务可扩展性

        可扩展性,如我们在之前的主题中讨论的,可以水平和垂直应用于适应服务负载。基于提供商的设备,通常存在物理扩展限制,但消费者也可能会设置扩展限制以防止成本超支。

  • 水平存储可扩展性 – 基于服务工作负载的存储设备容量限制。例如,可能指定存储扩展的100GB限制。
  • 水平服务器扩展 – 这是服务器池中允许的虚拟服务器实例数量。例如,可能在IaaS或PaaS服务中为自动扩展架构指定最多4个虚拟服务器。
  • 垂直服务器扩展 – 这是虚拟服务器允许的垂直扩展。例如,在IaaS或PaaS服务中,扩展可能限制为8个CPU、8GB内存和800GB二级存储。
服务弹性

        通过云提供商使用冗余和复制机制和架构来实现弹性。云提供商提供QoS指标来衡量这些措施的有效性,以便消费者可以考虑额外成本。

  • 平均故障切换时间(MTSO) – 完成故障切换到另一个地理位置的复制实例的平均时间。例如,提供商可能会声明MTSO为5分钟。
  • 平均系统恢复时间(MTSR) – 从严重故障中完全恢复的平均时间。例如,提供商可能会声明MTSR的最大时间为一小时。

        请注意上述示例中的时间段差异。故障切换可以比完全恢复未复制的虚拟服务器快得多。这可能需要从备份中恢复数据,可能是磁带,并从备份时间使用事务日志重建数据。自然,故障切换系统比简单恢复系统(不具备实时数据复制功能)更昂贵。

活动4:服务质量指标

        问题:本文讨论的哪些QoS参数如果SCU考虑部署私有云将是相关的?QoS

        回答:如果SCU考虑部署私有云,相关的QoS参数可能包括:

  • 可用率 – 确保资源对用户的高可用性。
  • 响应时间 – 提供快速的服务响应以满足用户需求。
  • 服务可靠性 – 确保服务在不间断的情况下可靠运行。
  • 网络容量 – 确保有足够的带宽支持大量用户和数据传输。
  • 服务弹性 – 提供快速的故障切换和恢复能力以保证服务连续性。

        问题:阅读此报告并识别服务协议和服务管理指标之间的差异:NIST

        回答:服务协议(SLA)指标侧重于服务提供商和消费者之间的合同条款,包括可用性、性能、响应时间和恢复时间等指标。服务管理指标侧重于内部操作和管理流程,包括故障排除、性能监控、容量管理和变更管理等。

SLA 指南 (SLA Guidelines)

        在本节中,我们将从消费者和提供商的角度来看待一些SLA工作的指南。我们将基于教科书中的指南,这些指南作为需要考虑的问题列表呈现。

  • 将业务案例映射到SLA – 业务案例推动云服务的实施。业务案例将有其自身的服务级别规范,因此必须将其映射到云提供商的SLA。当系统实施交给技术人员时,可能会忽略这一点,因为他们可能不清楚或不认识到所需的服务级别。例如,业务案例可能暗示数据量或响应时间超出云提供商的SLA。
  • 内部SLA和云SLA – 大型组织将拥有内部系统和云系统。通常,内部系统将与内部组签订SLA协议,因此必须实现两者之间的映射。云提供商的SLA将比内部SLA更详细,因此需要一定的工作将内部SLA协议映射到更详细的云提供商SLA。
  • 了解SLA的范围 – 如我们所见,云提供商使用许多机制和架构来实施云服务。云消费者必须仔细了解使用的云系统,以便清楚哪些提供商的SLA组件是相关的。
  • 了解SLA监控的范围 – SLA必须指定监控的适用范围。例如,监控虚拟服务器内的事务响应时间将产生比在云提供商防火墙外部监控更低的数字。后者将产生更高的响应时间,因为内部提供商网络和防火墙本身会引入延迟,从而增加测量的响应时间。
  • 应用适当的粒度 – 云提供商的标准SLA可能无法满足消费者的详细要求。例如,SLA可能保证最大响应时间为1秒,而客户可以接受如果平均响应时间低得多。由于提供商的SLA不提供平均响应时间,这可能是个问题。
  • 定义不合规的处罚 – 如果云提供商未能达到其SLA承诺会发生什么?在默认情况下,消费者必须决定是否转向另一个提供商。然而,当消费者首次比较提供商时,消费者将能够比较覆盖不履行风险的激励措施。为了竞争消费者,提供商可以提供财务处罚、付款退款、免费访问和其他处罚,使消费者相信SLA将实现,或者至少消费者将得到未能实现SLA承诺的补偿。
  • 纳入不可衡量的要求 – 一些QoS要求无法衡量。例如,消费者的数据安全性不能绝对保证。然而,提供商可以提供保证他们将实施某些安全实践,以尽量减少安全漏洞的可能性。
  • 披露合规验证和管理 – 这是提供商如何衡量SLA中提到的指标的披露。SLA还应披露任何由外部组织对提供商施加的审计或监控。
  • 包括指标公式 – 这些是如何从监控收集的数据计算SLA中指定的指标的精确公式。一些SLA将声明指标而不指定如何计算。
  • 独立监控 – 可以从第三方组织购买独立的云服务监控。如果消费者怀疑SLA未达到,即使提供商说已达到,这可能是值得的。注意,可能无法监控云提供商内部系统的指标。然而,可以由第三方监控外部可见的指标,例如响应时间和正常运行时间。
  • 归档SLA数据 – 云提供商可能会归档SLA统计数据,并与消费者共享。隐私法规可能要求提供商在云消费者终止与云提供商的合同时删除数据。此外,云消费者可能希望保留历史数据,以便与新云提供商的统计数据进行比较。一般的隐私考虑也应在SLA中规定,例如存储的内容和谁可以访问这些内容。
  • 披露跨云依赖关系 – 云提供商可能会将云服务分包给另一个云提供商。这可能会影响云提供商做出的保证,这种安排应向云消费者披露,可能包括消费者正在处理的云提供商提供的SLA详细信息。
活动5:SLA指南

        请阅读AWS SLA并总结你有权使用EC2、DynamoDB、RDS和Lambda的权利:AWS SLA

回答

  • EC2:AWS保证EC2实例在一年内的正常运行时间为99.99%。如果AWS未能达到此承诺,客户将有权获得一定的服务信用。
  • DynamoDB:AWS保证DynamoDB在一年内的正常运行时间为99.999%。未达到此承诺的情况下,客户可获得服务信用。
  • RDS:AWS保证RDS实例在一年内的正常运行时间为99.95%。未能实现此承诺时,客户有权获得服务信用。
  • Lambda:AWS保证Lambda函数执行在一年内的正常运行时间为99.95%。如果未能达到承诺,客户将获得服务信用。

        这些SLA确保客户在出现问题时可以获得一定程度的补偿,增加了服务的可靠性和客户满意度。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Yamai Yuzuru

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值