临时工说: 阿里云的事故,或许是一件好事,为阿里云的技术人员吐吐槽

开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, Oceanbase, Sql Server等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,可以解决你的问题。加群请联系 liuaustin3 ,(共1700人左右 1 + 2 + 3 + 4) 3群突破 490已关闭自由申请如需加入请提前说明,新人会进4群(210+)准备开5群,另欢迎 OpenGauss 的技术人员加入。

阿里云出现故障,这是一个很正常的事情,实际上故障天天有,但故障的范围和故障的影响是一个故障被小事化了,或者大事画大的根本。根本上阿里云的故障被放大的主要原因,还是和人性有关。当然和技术也有关,但逃不开人性。

一句话,阿里云的故障被放大的最大的原因是,夸,夸,夸,什么意思,平时不注意说话留半句,而是把弓拉的太满,导致众人的反感,在故障的时候反感被集中释放,产生了放大的效应。这是一个根音,同时还有一些其他云的人,在落井下石,这也是我看到的。所以阿里云的故障有多大不知道,但是人缘不好惹众怒这点是结结实实的。

通常遇到技术故障后我们工作的方式大体如下

1  评估故障的影响范围,快速定义当前故障的等级以及是否会持续升级

2  评估故障解决需要的时间长度和方案 A B C 的利弊与推动方案的执行和实现

3  紧急处理的方案与实现,过程的跟踪和点位的报告以及方案正确性不断的确认,与方案变更

4  故障解除后,根因和后续的一些声明和解释

这里不好评价,这些部分阿里云做的如何,如何消除的影响,对客户的影响点在哪里,因为缺少同类型的云也存在类似的问题后的处理方式的对比。

但这次的故障必然会爆发和流传一段时间,比如阿里云不稳定,经常出问题,其他的云的销售,必然会使用这个话术来对阿里云进行攻击,减少阿里云客户的份额。

说到这里,作为阿里云的大客户,在数据库技术上个人目前的感受,阿里云的数据库技术是可圈可点的,至少目前其他的云的数据库技术,我只能报以 HEHE. 在怎么攻击阿里云,数据库的部分其他的厂商建议可以先做好自己的技术,在去攻击,因为你说人家的时候,你自己根本就没有,这就很尴尬了。

那么这个故障本身,的确的有人负责,谁负责呢,阿里云的管理人员,或者管理的领导,此前一直都在各种信息通道中,爆出阿里云裁员的信息,当然从一些私人渠道,也获知一些之前服务阿里云的技术大咖有出走的情况。具体的问题,咱们不敢胡说,但是一个云厂商,天天被传裁员,这个事情对外很不好,影响很坏,对内让一些技术高手产生离职另谋高就的想法和行动 ,或一些人在工作不是很上心的后续反应,因为没有归属感。阿里云的管理层对此应该负有责任,稳定技术团队,设计更好的流程,让工作人员有信心更好的服务于客户和相关的产品是管理人员应该做的事情,而不是搞所谓的毕业,以及不合理的考评方式,而导致人员流失后,产生各种各样的故障。

因经常和阿里云的客服和技术的同学进行沟通,根据目前了解的一些情况,简单阐述一下外人看阿里云的技术同学的工作环境的问题

这里列举几个例子

1  值班:值班这个事情大家都理解,我们也值班,但是值班和值班不同,阿里云的技术人员,平时在搞开发,值班是轮换的,值班在阿里云的世界里面应该是一个噩梦,虽然阿里云的客服会在外部将客户的各种需求挡住,但是一些使用系统的老韬会绕过客服,直接找技术人员解决问题, 如果每天都有人在骚扰,并且在任何时间,那么没有几个人没有怨气的,在值班的时候同时还需要进行相关核心的工作,这样的工作方式不合理。CPU有多核心那是机器,而人既要进行核心的数据库编码工作,同时还要解决各种“胡搅蛮缠”客户的各种问题,并且寻根溯源,而且7*24H,终究他们是人,不是机器,值班就是值班,不能做其他的工作,一心不能二用,还是那句话他们是人,不是机器,CPU 上下文切换还需要缓冲。

2  再高的职务都要编码,有编码量的KPI:这个事情看似合理,实际上干过技术管理职位的都比较清晰,大部分有对自己有要求的人,多都不愿意放弃自己的技术,如果一个人管理上百人技术管理人员,还对他有代码量的要求,并且还要规划核心的一些技术方向的工作,这是不合理的,从某些角度,自愿和被强制KPI这是两个概念,这些人都有自驱力,无需把铁链锁到脖子上,而阿里云人力资源订立的一些让外人看上去都不大合理的制度,是让一些技术管理的人员无法专心做好分内工作的一个原因,不合理的KPI,归总起来还是那四个字,既要也要。

3 成本机制导致的阿里云的客服和二线技术人员的比例失调,这也是一个根本的原因,因为客服都是外包的人员,之前文章也提到过流动性高,专业性不高,同时当前国内的环境客户的素质也不高,导致客服每天的怨气也很大,大部分的矛盾就激化在这里,当客户一次次无法获得想要的答案同时他也表达的不是很清楚的情况下,客户经常被引导到错误的方向去解决问题最终导致问题的解决是南辕北辙,等到客户的耐心都失去了,在让客户和二线技术沟通的时候也是带着满满的愤懑,然后将怒气全部无差别的释放给二线的技术,我是理解成本核算的原因,及市场竞争激烈导致的人员的成本和服务方式以及服务质量的问题,95%的问题可能都是客户自己的问题,5%的问题是阿里云的问题,但我们为什么不能好好分析一下,给这些客户打上标签,比如像我这样的客户在发起提问的时候,标一个黄色的标签(脾气不好,有一定专业技术性,没有耐心,大客户,无法解决直接转二线),阿里云在淘宝天猫给客户大数据分析的能力呢,咱们不用到这里,明明可以给这些人打上标签,提高服务的水平,降低矛盾激化的百分比但为什么不做这个事情呢,把95%的能力,用到5%高质量的客户身上,而不是要靠客户发怒后再好好解决的工作模式。

实际上心里还有一些东西,但基于当前身体不适发烧ING,所以就写到这里,阿里云的技术人员的素质,水平是国内高质量的存在,尤其我接触的这些people们,但管理人员的素质水平,综上所述,呵呵,这里不多言,是管理人员的问题,终让技术人员背锅,合理吗?题目中或许是好事,这个好事的前提是阿里云的管理人员你们的反思,做一些更有人性的事情,做出改变这才能事好事,如果光去开除或者拿技术人员出来背锅,那必然不是一个好的开始。

每次技术的故障,背后光是讨论技术的问题这就是悖论,上面所提到的一些管理方法或许就是阿里云一次次故障的最终根源之一,阿里是第一个提出”毕业”理念的公司,更快的新陈代谢对于公司从宏观上是好的,让老白兔滚蛋,但是在你这样的管理方式下,会有更多的,老虎,狮子,大象,在看透把人当做干电池的人性后,离开,技术事故是单纯的技术事故,真单纯!

0056493ab17976db9cc0c44e1677dc46.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值