数智时代,运维的出路在哪里?

在运维工作中,经常被贴上这样的标签:背锅侠?电脑修理工?救火队员?35岁被退休?996/007等等,作为运维我们也经常这样自嘲。面对云计算、云原生等新生技术的快速发展,自动化和智能化趋势,逐渐替代传统运维,我们该如何破冰当下的窘况,如何在企业中,凸显运维的价值和不断突破个人职业发展的天花板。 

以下是6月2日IT东方会组织T-Chat: 互联网职业大揭秘之运维电脑修理师?

时间:2021年6月2日 19:00-20:30

主持人:Geekwolf(前iPayLinks运维和安全负责人)

嘉宾:陈兵(轻享科技运维负责人)、樊富春(夜神NOX运维负责人)、肖金光(梦网视讯的运维负责人)、邹轶(在线途游运维总监)

嘉宾们进行了精彩的分享:

01 运维日常工作的一天是怎么样的?真的很苦逼吗?

  1.  工作经常被各种杂事打断,无法专注

  2. 半夜爬起来处理故障

  3. 帮业务妹子装系统、教软件

  4. 帮研发解决环境问题

  5. 最重要的,干完这些活还要做好监控、搞好发版、弄好自动化还要撸代码

琐碎的工作,无终止的问题,既是挑战更是机会。换一种思路,自我驱动,提升个人认知高度和团队影响力,也许就是一种享受。

02 工作中印象最深刻的一次故障?从中获取了哪些经验?如何锤炼团队的?

轻享出行陈总:有一次下雨天,大量用户反馈无法叫车问题

     首先,要站在用户的角度去思考,如何快速最大限度的让平台或者部分核心功能先可用。当时是做了服务降级,先确保了用户能够经常下单派单。在回头深挖问题原因,从根本上解决问题

夜神NOX樊总:生产环境被大流量攻击打满带宽,导致系统不可用

     经多次定位才找到根因,源站响应慢、请求量大,大量请求被pending,导致的连锁反应。通过提高CDN缓存命中率,降低源站压力;兼顾稳定性和成本,部分流量走专线、部分流量不走专线,降低专线负载;优化源站性能。

     遇到紧急事件和故障并不可怕,关键是我们要有预案和能力去应对。同时,也给运维工作带来了更高的要求:熟悉业务、结合预案自动化处理的能力、发现问题并从根本上解决问题的能力。

    作为运维管理者,要多给团队锻炼解决问题的机会,不断的锤炼团队从惊慌失措到独立快速定位解决问题的过程,要有这样的魄力和担当。俗话说事不过三,面对故障,既要立规矩,也要讲人情。

03 电脑不离身,昼夜午休,如何保持身体健康?

   这个话题隐藏了一个潜在的问题,我们如何确保生产稳定,都通过什么样的技术和管理手段来实现?混沌工程?找到稳定性的最大约束点或瓶颈彻底解决?持续改进?还是人肉顶,24*7被动处理解决问题?管理上有什么样的方式方法带来团队冲出重围?)

    梦网视讯肖总:通集群部署,完善监控,和一些自动化的工具来快速定位和保障生产稳定性。

    轻享出行陈总:通过将关键服务拆分,实现弹性伸缩,在服务宕机或服务异常时,自动拉起相关的服务,再配合自动化的预按工具人工介入处理。

    系统稳定性是一个工程问题,需要从业务、研发、测试、运维共同保障,通过混沌工程方法来发现稳定性瓶颈,持续不断改进。

    各位嘉宾,也表示工作之余要多加锻炼,”身体好才是真的好“。保持好的心态,才能更好的处理日常繁琐的事物。冥想、五公里跑、和团队一起乒乓球比赛、徒步怕啥等都是不错的锻炼身心健康和培养团队凝聚力的好方法。

04 各个层级的运维工作重点是否有所不同?作为一线运维掌握哪些软硬技能能够快速走向人生巅峰?

夜神NOX樊总:初中级要求很强的执行力和学习能力,能够把一件事做到闭环管理;高级就需要有比较强的运维架构和编程能力及发现问题、解决问题的能力;作为运维的leader更要要学会如何思考,帮助团队建立影响力。

梦网视讯肖总:作为一个运维,心态要随和,知识面广,学习能力强,具备很强的责任心;成长为运维leader之后更多要学会如何管理团队和跨部门协调沟通的能力。

轻享出行陈总:从一个小白运维成长为一个运维负责人,最大的变化就是技术思维的 转变,善于和其他团队建立盟友关系,找到管理抓手,适当为团队争取利益。

05 如何看待AIOps?如何提升运维作为支持部门的价值?

        AIOps是未来的发展趋势,从当前的技术成熟度来看,AIOps能够帮助我们在异常检测、告警收敛、日志分析、故障自愈等方面取得一定的效果,但真正将故障自愈应用于生产还需要谨慎。各位嘉宾也表示,当前工作重心还是放在如何提升工作效率,通过自动化的方式来最终解决业务问题。

        提起运维作为支持部门如何提升在企业中的影响力,是每一个运维负责人一直在思索的问题。    

        轻享出行陈总:提到运维或者技术,我们思考的本质是什么?技术其实就是一个实现手段,随着业务变化而变化。无论是技术驱动业务,还是业务驱动技术,最终要解决的还是业务问题。

        夜神NOX樊总:运维组织是一个技术服务的性质,应该多与业务相结合,把运维的能力可视化出来,通过业务数据体现出来。 

       无论是可视化运维工作,还是突破部门边界,承载更多业务属性,还是将运维能力通过像云市场增值价值,我们需要找到一个突破口。在线徒游的邹总,也分享了他的宝贵经验:

      影响力的输出:

对外:通过演讲交流输出、通过工具产品(开源,商业化)输出

对内:输出方法论、思维模式、通过产品工具去封装运维业务能力和三方服务能力,赋能给项目组

对内输出两个关键点:

1、立场要站在公司全局,不要站在运维角度

2、要选用杠杆率最大的内容,要能严重影响到其他部门,影响到公司的内容

外部输出和内部输出相结合,相辅相成,比如内部产品工具做的好对外赋能,通过外部的打磨又反过来影响内部的工具产品的品质提升,这样进入一个正向循环。

06 最后,各位嘉宾也分享了对自己影响非常大的几本好书:

《金字塔思维》

《OKR工作法》

《刻意练习》

《高效能人士的七个习惯》

《亿级流量网站架构核心技术》

《进化-运维技术变革与实践探索》

《认知:所谓成长就是认知升级》

把问题当作机会,自我驱动,敢于尝试新事物,跳出职业圈子,努力提升认知思维,未来或许更加一帆风顺。

长按二维码加群一起聊聊~

长按二维码关注公众号

*本公众号所发布内容仅代表作者观点,不代表社区立场

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值