运维的变化

 

作者:简胖
链接:https://www.zhihu.com/question/442323148/answer/1709512854
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
 

运维的要求越来越高了,同时运维的生产力也在不断的提高

最开始只是最常见的分布式部署,用来应对高并发和高可用,这时候就是需要会一些高可用配置,集群部署,自动化工具就可以应付了。

随着互联网业务的不断发展,开发那边提出了敏捷开发,发布的频率变得非常之高,这个时候就需要运维这边能够做好相应的支持,也就是devops。

然后随着微服务化,服务的编排与调度就变得非常重要了,这个时候对运维的要求就是docker与k8s。

然而仅仅靠编排与调度并不能满足越来越多的微服务的管理需求,如果全指望开发来解决微服务治理(服务降级,熔断,灰度等等)功能难度很大,于是把微服务治理这一块的事情也交给了运维,那就是server mesh,这样开发就只要专注业务,不需要花时间在微服务治理。

到现在这个阶段,因为微服务的规模实在是太庞大了(几万,几十万以上的pod),而且每天又有几百上千次的服务发布,维持系统的稳定性就成为了巨大的难题,任何一次的发布都可能会影响到整个系统的稳定性,系统也会存在越来越多的隐患,传统的测试方法在此时已经失效,这个时候对于运维的要求就是混沌工程。

未来的话,也就是通过机器学习来不断的调整和优化来保障系统的稳定性了,但是这个在很长时间内,只会存在于大型的公有云服务商和大型互联网公司,因为机器学习也是需要巨大的算力和海量的训练数据来提高准确度,算力这个还好说,海量的训练数据,一般的公司都很难有,唯有公有云服务商,可以很容易获取大量的客户运维数据来对AI进行训练。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
云计算时代下的企业IT运维变迁   IBM 谭瑞忠:部署一些系统资源,这样的一些事情,就是说用户有一个终端界面,他可以说需要两台UNV,需要怎么样的一些什么环境,只要有页面请求,就可以做出来了,这是一个,另外一个是就是流程管理,这是很多用户包括IBM自己已经在做的事情。   第二个还可以扩展,什么意思呢,就是我不需要终端用户用人来请求系统的资源,我完完全全可以根据一个应用来请求系统资源,比如说我跑一个应用,比如说一个网页比较流行,点击率很高,突然发现支持这个网页的服务器不够了,在这种情况下,有些部署之后,应用可以自动根据地域的规则,自动把下面的一些资源能够重新动态的调配,这样可以满足动态的请求,有一些案例蛮有意思,比如说(ORD)(E卡末),在美国(克瑞斯摩斯)有很多用户来点击这个网页,但平时没有很多,在这种环境下从服务器的数量来讲,要最大数量的维持这些服务器,根据动态部署来调配这个事情,这是一个很好的例子。   如果实现弹性扩展动态资源之外,下一步可以进入到应用创新,应用创新刚才已经讲到了,如果我的应用已经有一些对系统资源或者其他资源动态的需求的时候,我完完全全可以通过这个环境很快帮助这个应用重新调配、重新部署它所需要的资源,所以说在这一步之后,回到刚才云计算的分析,它就慢慢实现了云的特性,所以我就把这个叫三步学,一二三,我们IBM在一步一步走,而且自己在用,而且客户也在用。   下一页是我云计算对我们的科研人员的一些挑战,这是我的一个总结,我感觉第一你要认识到云计算是我们在做十年二十年之后管理创新的扩展,和事业的延续,当然(奥得死)是IBM的运营人员,第二就是要认识到云计算真正的价值,不要仅仅认识在定义上,认识到给我们业务、企业、社会带来的价值,然后去推崇这些价值,不是推崇这个云,第三看我们企业的现状,能够足够确定我们企业在上云计算后要做的事情和走的途径,每个企业情况不一样,要做的事情也不一样,每个企业都需要我们运营人员深入分析,然后决定怎么样能够逐步实现云所在的价值,最后一个是业务人员和开发人员合作,怎么样把企业一步一步的从现状比较动态的资源部署和动态服务知识的一些境界里面去。   每个人都可以请求一些资源,服务器、内存,每个员工都有这个能力,进到他所提供的资源里面做一些创新的工作,然后这个云已经是完完全全在我们IBM里面,所以有很多数据就是我们的回报,一些用户收益的信息在这里面反映出来了。就是逐渐推荐,包括很多在绿色方面的经验,我的演讲就是这些,花了很多时间了。有没有什么问题?   问1:我知道在五年前IBM比较流行,到了90年代以后,IBM开始推广大型机。如果从商务角度来说,IBM看待大型机和云计算有什么区别?   IBM 谭瑞忠:如果我们有大型机的话,实际上我觉得云有云的价值,大型机有大型机的价值,如果工商银行来卖我们的产品的话,它肯定不会买一个云的功能,买大型机比较有保障,云是针对另外一些用户,就是说这些用户可能需要一个是购买不起大型机,也没有必要,还有改变想实现动态部署、资源整合的功能,刚才你提的这个问题蛮有意思,我也曾经想过这个事情,我们是从硬件开始研发,硬件慢慢部署到软件,现在回来了,我们再开始看硬件,硬件哪些可以做的更好,主机就回来了,但是慢慢又发展成为像(故们)公司,一个我觉得很创新的一个公司,它把很多小型机放在一起,不需要大型主机可以做同样的事情,当然也是在探索的过程当中,还没有到大型机不用了用一些小型机的时候,所以我觉得很多事情都是这样的,我感觉云如果有大型机的话,需不需要云,如果我在IBM内部问卖主机的同事,他一定说不需要,他往往是从商务的角度来讲,因为他主机可以实现任何一个分布式计算的功能,但是返过来如果卖一些分布式云的人,所以这完全是一个商务上的一个理念了,所以我现在没有直接的回答,这两个没有可用可不用,因为两个确实有各种不同的情况,比如说我现在碰到一个问题,我的客户问我,现在硬件可以保证主机99.99%不会宕机,可以做这个保证,软件能不能给我一个保证,我的客户经常会问我,软件能不能给我一个这样的保证,我不能给,我给不出来,所以软件还是蛮新的一个领域,所以现在就是说分布式计算往往是想用软件来控制硬件,不需要硬件的一些东西,软件可以控制到了,因为很多应用适合于这种情况,这是好事情,但是像工行这种事情的话,怎么样用软件来实现我所需要的99.99%的保证,这个做不到。   问2:有没有什么大的成果?   IBM 谭瑞忠:软件我们有一些成果,无锡去年做的比较大一点,这个云从动态部署开始入手,把一些(不瑞克)服务和(艾斯放)整合在一起,然后在上面可以实现一些用软件可以控制的RDB,就是说动态的终端用户请求一些资源,可以在后台分布这种事情,然后扩展到怎么样实现一些业务上动态部署的一些步骤这是一个,在安全

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值