2024年运维最全浅谈运维工程师的开发能力的培养_it运维如何提高开发能力

侧重点是开源技术方案的使用,为云服务的稳定提供保证。随着业务不断发展,服务器规模扩大,就需要具备大规模服务器的批量管理能力。要求对开源技术解决方案有一定的掌握,主要面向基础运维平台建设,运维工具的开发,提高运维效率。硬件层面的资产管理。系统层面的管理例如vmware openstack虚拟化,以及docker k8s容器化。应用层面例如prometheus监控,elk日志,集群,数据库等开源服务管理。重点在于广泛使用开源技术保障服务的稳定,为项目的稳定运行提供保障。

3. DevOps

侧重点是开发运维平台,要求较高的开发能力。主要是管理应用的全生命周期,负责自动化运维平台的设计和开发,实现运维标准化、自动化、平台化。例如开发CMDB平台、作业平台、工单系统、告警平台等。以及充当业务开发与业务运维中间人的身份,从中发掘业务瓶颈并推动优化与改进。

4. SRE

侧重点是从业务角度提升运维质量*。负责软件和系统的架构设计,运维流程的优化,让公司服务以及系统运行得更加可靠,更加稳定,扩展性更好,更能有效地利用计算机资源。要求技能包括算法,数据结构,编程能力,网络编程,分布式系统,架构设计,故障排除等能力。SRE重视开发,重视效率,追求自动化,专注于整个软件系统的生命周期管理。
需要明确的一点是DevOps 首先是一种文化,后期逐渐独立成一个职位,而SRE从一开始就明确是一个职位。DevOps更需要开发能力,而SRE更需要知识的广度。DevOps 工程师掌握相关技能之后,也有机会可以发展为 SRE 工程师。 而一位合格 SRE 工程师,在有选择情况下面,我相信不会去转型为 DevOps 工程师。

二、运维开发技能学习路线

在这里插入图片描述

三、常见的运维开发项目案例

1. 公有云管理平台

● 项目背景
大型互联网公司出于成本、可靠性等因素,往往会购买多家云厂商产品提供服务。但在日常运维工作中,高频的操作往往也只是查看主机配置信息、当前机器状态、以及资源到期时间、服务器强制重启、CDN资源刷新、COS存储查看、日志下载等操作。

可以根据上述需求,开发一套公有云管理平台。将所有资源列表形式展现出来,配置信息、当前状态、到期时间等关键内容直观展现出来,并使用标签的方式,实现资产的便捷筛选。

只授予开发人员常用操作,例如CDN刷新,日志下载,COS存储查询等操作权限,避免登录云服务器控制台误操作情况发生。

● 项目亮点
使用腾讯云、阿里云、华为云等公有云厂商sdk,实现资产信息的查询等高频操作

使用celery实现信息异步定时更新入库

用户权限管理,开发人员和运维人员权限分离

使用antv-g6实现资产树结构

使用echarts将资产统计信息可视化展示

2. CMDB

● 项目背景
企业中IT资源种类繁多(机房、服务器、存储设备、网络设备、项目业务划分等)且需要频繁更新,传统的excel表格维护更新方式已不能满足需求。此时就需要通过开发资产管理系统,实现资产的自动发现和信息同步更新,保证数据的准确和一致性。除此之外还开放API接口与现有的运维体系结合,为作业系统、工单系统等平台提高IT数据支撑。

● 项目亮点
由于资产的字段,对应关系频繁更改,传统的关系型数据库已无法满足需求。通常采用MongoDB存储数据。使用mongoengine库完成数据库的操作。

使用ansible的API接口调用setup模块抓取服务器硬件信息,支持手动同步和定时同步信息。

也可以使用shell脚本或者go开发exporter,定期向cmdb接口上报服务器信息。

提供动态 Inventory 清单接口,方便ansible调用执行批量化操作。

提供完善的资产信息、模型、对应关系增删改查接口,方便其他工具平台调用。

3. 作业平台

● 项目背景
面对批量管理主机的需求,已有成熟的ansible,以及web工具Tower,但是缺乏现成的API接口,无法与现有的自动化运维平台直接调用。

随着服务器规模增多,存在大量的定时同步、备份、清理等任务脚本。需要集中化管理定时任务,并对任务执行情况一目了然。

当进行服务批量部署、软件包批量更新时,具备批量文件传输的能力。

记录所有通过作业平台页面或者API调用的操作记录,提供任务重试和历史记录查询的功能。

● 项目亮点
将常用自动化操作(例如给开发人员创建普通用户账户设置权限、常见服务部署、配置文件更新等操作)提前编写playbook。当需要执行常用自动化操作时,调用CMDB接口获取动态主机清单,并在前端传入相关变量参数,完成playbook变量替换,使用ansible执行playbook,完成相关的自动化操作。

使用对象存储或者ansible所在服务器本地目录,实现文件上传功能。存放常用shell脚本、需要批量分发的文件,便于ansible调用相关文件执行自动化操作。

开发定时任务管理模块,使用异步多线程执行。支持任务结果查询验证功能,实现定时任务的统一集中化管理。

开放提供API接口,支持传参调用执行批量任务并返回执行结果。

4. 工单系统

● 项目背景
在公司内部,项目上线、配置变更、调整权限等操作,往往都按照运维管理制度,依次由负责人审批,通过后再执行相关具体操作。传统的资源申请基本是通过邮件,存在沟通成本高,消息处理不及时的问题,且出现问题后回溯麻烦。

开发一套工单系统,可以将运维平台各个自动化程序组件相关联打通,可以极大的规范内部管理流程,提升沟通及管理效率。

● 项目亮点
与公司内部邮箱或通讯软件集成,实现每步流程申请人和相关审批人邮件或消息通知。

与钉钉或企业微信的用户列表集成,避免人员流动时频繁手动更新维护数据。

与作业平台集成,当领导完成审批后,直接调用作业平台API,执行一系列自动化的操作。

在前端使用流程图方式展示整个操作的完成流程,以及当前完成进度。

5. 告警平台

● 项目背景
为了保障业务稳定,通常会采用多种监控服务实现告警通知,但通常都存在告警复杂而凌乱,无法将告警信息进行灵活分类,缺乏统一管理的能力。这样就加大了运维人员对告警信息的判断难度,进而无法快速的的定位到根因,也就无法快速的解决问题。

传统的告警配置,告警通知人员/通知组,告警等级在创建告警时已配置,不具备灵活将告警内容通知至值班人员和告警长期未处理,告警严重性等级提升的功能。

● 项目亮点
告警统一收集汇总。将现有的Alertmanager、grafana、kibana、以及其他的脚本告警统一收集展示,方便运维人员清楚知道当前系统存在的问题。并提供历史告警查询功能,便于分析当前容易产生的告警,促使不断优化改进,降低告警产生。

灵活的分配策略。根据不同的应用,选定不同的筛选条件,将条件相结合,让指定的告警通知到特定的人。并于现有的值班系统相结合,使每条告警按不同的告警等级以微信、邮件、短信、电话的方式通知到值班人员和第一负责人。

当告警在指定的时间段内未恢复时,启动告警升级策略。将告警通知至第二负责人,以此类推。

与工单系统集成,自动将告警事件指派给对应负责人,并创建工单提示负责人及时处理故障。

6. 应用发布系统

● 项目背景
应用发布系统使用现有的Jenkins发布平台或者Gitlab CI均可。但是缺乏与现有的运维平台建立连接的能力。理想的应用发布系统应当是当开发人员提交申请单,领导审批完成触发自动更新操作,从发起到结束形成闭环。可以利用Jira、Gitlab的webhook功能,以及Jenkins插件的灵活性,实现应用发布系统与工单系统的紧密结合。为项目的敏捷开发、快速迭代提供运维保障支撑。

● 项目亮点
与工单系统紧密结合。当开发人员完成新功能开发后,只需在工单系统提交新版本上线流程。待领导审批后,执行自动化部署操作。

与Jenkins紧密结合。通过webhook自动化完成分支更改、部署发布流程,减轻人工运维操作工作量。

与CMDB紧密结合。当完成版本发布后,自动更新相关记录。

四、运维平台案例参考

1. 蓝鲸智云平台

https://bk.tencent.com/docs/

2. spug

https://spug.cc/docs/about-spug/

3.CODO

https://github.com/opendevops-cn/opendevops

五、常见运维场景自动化思路

1. 新建资源

在这里插入图片描述

2. 发布流程

在这里插入图片描述

3. 配置变更

在这里插入图片描述

4. 故障处理

在这里插入图片描述

最全的Linux教程,Linux从入门到精通

======================

  1. linux从入门到精通(第2版)

  2. Linux系统移植

  3. Linux驱动开发入门与实战

  4. LINUX 系统移植 第2版

  5. Linux开源网络全栈详解 从DPDK到OpenFlow

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

第一份《Linux从入门到精通》466页

====================

内容简介

====

本书是获得了很多读者好评的Linux经典畅销书**《Linux从入门到精通》的第2版**。本书第1版出版后曾经多次印刷,并被51CTO读书频道评为“最受读者喜爱的原创IT技术图书奖”。本书第﹖版以最新的Ubuntu 12.04为版本,循序渐进地向读者介绍了Linux 的基础应用、系统管理、网络应用、娱乐和办公、程序开发、服务器配置、系统安全等。本书附带1张光盘,内容为本书配套多媒体教学视频。另外,本书还为读者提供了大量的Linux学习资料和Ubuntu安装镜像文件,供读者免费下载。

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

本书适合广大Linux初中级用户、开源软件爱好者和大专院校的学生阅读,同时也非常适合准备从事Linux平台开发的各类人员。

需要《Linux入门到精通》、《linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 16
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值