上云背景
作为阿里云第一批试飞侠,于2012年6采购第一个阿里云服务器,受于阿里云产品成熟度原因,果断放弃当时阿里云服务。2012年底走向自建私用云之路。但随着公司业务模式的日渐成熟,运维成本也逐渐增大。流量的洪峰一波接着一波,越来越感受到服务器性能瓶颈带来的致命伤害-----用“寝食不安”一点也不未过。由此,开启我的再次上云之路。
一、面临问题
目前我们公司研发50人的规模下,支持日均4000万以上的交易,自建服务器不仅设备成本高、带宽不足,后期还会面临着高维护成本、数据灾备等多重问题,对于初创型小公司来说没有任何性价比。随着客户数据量越来越大,我们不得不寻求更为专业的技术支持,帮助应对数据井喷、网络高峰、成本剧增等复杂难题。其中表现最为突出的问题如下:
- 网络问题(IDC运营商网络多次故障)
- io问题(多次出现机器io故障)
- 磁盘问题
- 自建mysql主动读写延迟严重
二、问题自救
早期的业务结构非常简单(all in one application),后台系统分为三大板块
1、业务服务:主要支撑各业务线产品功能的服务
2、金融服务:为业务板块提供各种金融场景功能的支撑服务
3、运营服务:后台线上运营工具
业务服务和金融服务数据库都部署在同一台机器的同一个MySQL实例中,运营服务数据库单独部署在另外一台机器的实例中。三大板块的应用程都部署到同一台服务器上。为了适应快速增长的业务以及满足数据库高可用的要求,服务架构开始了三次改进。
第一次改进:数据库主从模式改进
为了让数据库高可用