关于海量运维、运营规划,我想业界都没有准确的定义,假如说互联网的架构师用能否设计多高的摩天大楼来衡量架构能力,那运维、运营更多的是在关注互联网服务的质量、效率、成本、故障、瓶颈,用户的忍耐、抱怨等问题。

在接下来的日子里,将以质量、效率、成本为核心,从运营规划、管理、流程/规范、系统/平台,监控、告警、安全、优化、考核等几个维度结合案例来与大家分享自己的体会,内容大致如下所示。

前言

关于作者
痛并快乐着
关于互联网运维、运营

质量

规划篇

1. 架构规划
1.1 新趋势、新机遇、新挑战
1.2 产品、架构、成本生命周期
1.3 质量、速度、成本
1.4 专业化、平台化、持续化
1.5 可伸缩、可调度、可扩展
1.6 Set模型,集装箱改变世界
1.7 全网调度,速度与容灾并进
1.8 运维自动化,一切皆自动
1.9 海量导致架构取向,适用是王道
1.10 可扩展、可持续架构的体会
2. IDC规划
2.1 全球最复杂的基础网络
2.2 IDC属性、瓶颈分析及建议
2.3 IDC策略,分布致胜、速度第一
3. CDN规划
3.1 CDN发展现状与趋势分析
3.2 CDN厂商分析及外包细节
3.3 CDN节点分布及解析策略
3.4 CDN外包质量和风险控制
4. 预算规划
4.2 预算的作用及预算推导
4.3 服务器定制,切合应用与性价比
4.4 服务器需求,用数据说话

速度篇

1. 网站速度优化介绍
1.1 什么是网站速度优化
1.2 网站速度优化的价值
1.3 网站速度关键指标
1.4 影响网站速度的因素
2. 网站速度监测实践
2.1 网站速度监测概述
2.2 网站速度主动监测
2.3 网站速度被动监测
3. 网站速度分析实践
3.1 网站速度分析概述
3.2 网站速度分析工具
3.3 网站速度分析案例
4. 网站速度优化实践
4.1 速度优化概述
4.2 网络速度优化及案例
4.3 系统速度优化及案例
4.4 前端速度优化及案例
5. 防止网站速度退化
5.1 通过规范防止速度退化
5.2 通过工具防止速度退化

监控篇

1. 监控概述
1.1 监控定义和价值
1.1 监控体系和实现途径
2. 用户监控实践
2.1 访问监控,获取用户访问速度
2.2 URL监控,服务实时访问状态
2.3 劫持监控,了解全国劫持状态
2.4 内容监控,掌握网页元素变化
3. 机器监控实践
3.1 机器监控,机器运行状态可视化
4. 网络监控实践
4.1 网络监控,时刻掌控广域网变化
4.2 响应监控,IDC内服务响应监控
4.3 域名监控,做精准的DNS解析
5. 应用监控实践
5.1 应用监控,动态应用模块间监控
5.2 缓存监控,多缓存监控的方法
5.3 DB监控,数据库运行可视化

告警篇

1. 统一告警,如何具备千里眼、顺风耳
2. 告警分级,将告警分类区分对待
3. 告警模型,如何建立告警模型
4. 告警收敛,规避被告警淹没
5. 告警关联,1+1>2,让告警更具价值
6. 告警分析,用数据说话

安全篇

1. 漏洞扫描
2. 域名劫持扫描
3. 挂马扫描
4. CGI扫描
5. 网页篡改扫描

效率

管理篇

1. 配置管理,将所有资源标识并记录在册
2. 事件管理,记录、分类、诊断、解决问题
3. 问题管理,消除引起问题的根本原因
4. 变更管理,串联变更原因、过程、结果
5. 容量管理,对运营指标未来的量化、预测
6. 关于事件、问题、告警管理的一些体会

平台篇

1. 静态资源平台
2. 动态应用平台
3. 数据库托管平台
4. 逻辑服务平台
5. 缓存管理平台
6. 自动发布平台
7. 海量存储平台
8. PGV点击流平台
9. GSLB全网调度平台

流程篇

1、业务运维管理规范
2、系统用户管理规范
3、设备使用管理规范
4、应用安全管理规范
5、开发与编绎环境安全规范
6、故障分级和处罚规范

预案篇

1. 预案,从容应对危机
2. 预演,提高故障执行力

考核篇

1. 运维能力考核
2. 架构能力考核
3. 运营预算考核

成本

带宽篇

1.规模化导致带宽成为最大成本
2. 通过改变产品形态减少数百万成本
3. 带宽成本量化及可持续跟踪

硬件篇

1. 服务器分类、分级、分层定制
2. 按应用场景使用虚拟化服务器
3. IDC专区化,合适使用网络设备