前些年赵班长层总结过运维知识体系:https://www.unixhot.com/page/ops;对运维体系要了全面的阐述。
今天听了搜狐架构师一堂课程,感受颇深。现在结合个人理解,从以下几个方面做以阐述,若有错误,虚心接受批评指正。
个人认为,对于刚刚进入运维工作的新人来说,运维思维突破很重要:
(1)备份,容灾 ;
本地容灾,异地容灾;
数据的备份容灾是一个永恒的话题,如保证将业务产生的有用数据有效保护,当到不可预测的灾难时,能够保证数据不丢失。
从最基础的服务器考上考虑
如果是在同一个服务器上,实现备份首先要对数据进行复制,在该层面上我们如何将数据快速,高效的复制或者是实时复制
当然在同一个服务器上的数据备份,存在更大风险,当该服务器故障时,所有数据将会丢失,于是,我们需要数据在不同服务器上备份,这样就存在一个数据传输的问题,如何保证高效的数据传输。
再者,数据在同一个机柜或者机房存储,甚至是同一个地域,将可能受到不可预测的自然或者人为灾难的破坏,于是乎就是产生了,异地的数据备份容灾,对于异地的数据备份与容灾,数据传输的链路将更长,如何保证传输过程数据的安全,完成和实施备份。
系统备份,数据库备份;
从单个服务器的层面来考虑,系统资源的备份讲师恩重要的,蔡德明前辈在《鸟哥的私房菜》中阐述的清楚。
数据库上,我们有主从,主主等高可用架构,其次,对于非关系型数据库,我们如何考虑数据的持久化。
(2)数据迁移
其实,随着技术的发展,数据存贮已经不是传统的本地存储了,除非运行系统的必须资源。存储资源我们大都基于网络存储。其次,随着互联网的日新月异,大数据时代的到来,对大量数据的存储,如何实现快速写入与读取?
数据迁移要考虑的问题:
安全:如何保证数据在传输的过程中,不被窃取?
数据完整;如何在保证数据流不丢帧?
传输速度;如何实现数据的快速传输,给数据存储保证时效性的同时,提高客户体验度。
在数据传输上,我们如何保证传输速度和链路冗余。
(3)管理和业务分离
(4)变更管理
在我们互联网企业中,如何保证新服务上线以及服务变更的准确,迅速,有条不紊的运行。
(5)权限控制
对于大批量的机器,我们如何对其权限进行控制,又如何记录机器上被执行的相关操作。
(6)自动化
对于资源而言,我们如何去监控;
对于链路来说,我们又如何去监控: