扒一扒微信后台架构

我知道很多同学对微信后台很感兴趣,所以打算整理一些微信后台的技术栈,以及架构演进的历程。

偶尔也会写点自己在后台开发时的一些体验。

下面开始第一篇吧,先给大家介绍下微信早期后台是如何从0到1的。

2个月的开发时间,微信后台系统经历了从0到1的过程。

从小步慢跑到快速成长,经历了平台化到走出国门,微信交出的这份优异答卷,解题思路是怎样的?

作者 | 张文瑞

阶段一:从无到有

2011.1.21 微信正式发布。这一天距离微信项目启动日约为2个月。

就在这2个月里,微信从无到有,大家可能会好奇这期间微信后台做的最重要的事情是什么?

我想应该是以下三件事:

1. 确定了微信的消息模型

微信起初定位是一个通讯工具,作为通讯工具最核心的功能是收发消息。

微信团队源于广硏团队,消息模型跟邮箱的邮件模型也很有渊源,都是存储转发

微信消息模型

上图展示了这一消息模型,消息被发出后,会先在后台临时存储;

为使接收者能更快接收到消息,会推送消息通知给接收者;

最后客户端主动到服务器收取消息。

2. 制定了数据同步协议

由于用户的帐户、联系人和消息等数据都在服务器存储,如何将数据同步到客户端就成了很关键的问题。

为简化协议,我们决定通过一个统一的数据同步协议来同步用户所有的基础数据。

最初的方案是客户端记录一个本地数据的快照(Snapshot),需要同步数据时,将 Snapshot 带到服务器,服务器通过计算 Snapshot 与服务器数据的差异,将差异数据发给客户端,客户端再保存差异数据完成同步。

不过这个方案有两个问题:

  • 一是 Snapshot 会随着客户端数据的增多变得越来越大,同步时流量开销大;

  • 二是客户端每次同步都要计算 Snapshot,会带来额外的性能开销和实现复杂度。

几经讨论后,方案改为由服务计算 Snapshot,在客户端同步数据时跟随数据一起下发给客户端,客户端无需理解 Snapshot,只需存储起来,在下次数据同步数据时带上即可。

同时,Snapshot被设计得非常精简,是若干个 Key-Value 的组合,Key 代表数据的类型,Value 代表给到客户端的数据的最新版本号。

Key 有三个,分别代表:帐户数据、联系人和消息。

这个同步协议的一个额外好处是客户端同步完数据后,不需要额外的ACK协议来确认数据收取成功,同样可以保证不会丢数据:

只要客户端拿最新的Snapshot到服务器做数据同步,服务器即可确认上次数据已经成功同步完成,可以执行后续操作。

例如清除暂存在服务的消息等等。

此后,精简方案、减少流量开销、尽量由服务器完成较复杂的业务逻辑、降低客户端实现的复杂度就作为重要的指导原则,持续影响着后续的微信设计开发。

记得有个比较经典的案例是:我们在微信1.2版实现了群聊功能,但为了保证新旧版客户端间的群聊体验,我们通过服务器适配,让1.0版客户端也能参与群聊。

3. 定型了后台架构

微信后台系统架构

微信后台使用三层架构:接入层、逻辑层和存储层

接入层提供接入服务,包括长连接入服务和短连接入服务。

长连接入服务同时支持客户端主动发起请求和服务器主动发起推送;

短连接入服务则只支持客户端主动发起请求。

逻辑层包括业务逻辑服务和基础逻辑服务。

业务逻辑服务封装了业务逻辑,是后台提供给微信客户端调用的API。

基础逻辑服务则抽象了更底层和通用的业务逻辑,提供给业务逻辑服务访问。

存储层包括数据访问服务和数据存储服务。

数据存储服务通过 MySQL 和 SDB(广硏早期后台中广泛使用的 Key-Table 数据存储系统)等底层存储系统来持久化用户数据。

数据访问服务适配并路由数据访问请求到不同的底层数据存储服务,面向逻辑层提供结构化的数据服务。

比较特别的是,微信后台每一种不同类型的数据都使用单独的数据访问服务和数据存储服务,例如帐户、消息和联系人等等都是独立的。

微信后台主要使用C++。后台服务使用Svrkit框架搭建,服务之间通过同步RPC进行通讯。

Svrkit框架

(小北:Svrkit 框架就是日常开发最常使用的

Svrkit是另一个广硏后台就已经存在的高性能RPC框架,当时尚未广泛使用,但在微信后台却大放异彩。

作为微信后台基础设施中最重要的一部分,Svrkit这几年一直不断在进化。我们使用Svrkit构建了数以千计的服务模块,提供数万个服务接口,每天RPC调用次数达几十万亿次。

这三件事影响深远,乃至于5年后的今天,我们仍继续沿用最初的架构和协议,甚至还可以支持当初 1.0 版的微信客户端。

这里有一个经验教训——运营支撑系统真的很重要。第一个版本的微信后台是仓促完成的,当时只是完成了基础业务功能,并没有配套的业务数据统计等等。

我们在开放注册后,一时间竟没有业务监控页面和数据曲线可以看。

注册用户数是临时从数据库统计的,在线数是从日志里提取出来的,这些数据通过每个小时运行一次的脚本(这个脚本也是当天临时加的)统计出来,然后自动发邮件到邮件组。

还有其他各种业务数据也通过邮件进行发布,可以说邮件是微信初期最重要的数据门户。

2011.1.21 当天最高并发在线数是 491,而今天这个数字是4亿。

阶段二:小步慢跑

在微信发布后的4个多月里,我们经历了发布后火爆注册的惊喜,也经历了随后一直不温不火的困惑。

这一时期,微信做了很多旨在增加用户好友量,让用户聊得起来的功能。

打通腾讯微博私信、群聊、工作邮箱、QQ/邮箱好友推荐等等。

对于后台而言,比较重要的变化就是这些功能催生了对异步队列的需求。

例如,微博私信需要跟外部门对接,不同系统间的处理耗时和速度不一样,可以通过队列进行缓冲;

群聊是耗时操作,消息发到群后,可以通过异步队列来异步完成消息的扩散写等等。

单聊和群聊消息发送过程

这是异步队列在群聊中的应用。微信的群聊是写扩散的,也就是说发到群里的一条消息会给群里的每个人都存一份(消息索引)。

微信的群聊为什么不是读扩散呢?

有两个原因:

群的人数不多,群人数上限是 10(后来逐步加到 20、40、100,目前是 500),扩散的成本不是太大,不像微博,有成千上万的粉丝,发一条微博后,每粉丝都存一份的话,一个是效率太低,另一个存储量也会大很多;

消息扩散写到每个人的消息存储(消息收件箱)后,接收者到后台同步数据时,只需要检查自己收件箱即可,同步逻辑跟单聊消息是一致的,这样可以统一数据同步流程,实现起来也会很轻量。

异步队列作为后台数据交互的一种重要模式,成为了同步RPC服务调用之外的有力补充,在微信后台被大量使用。

KVSvr

微信后台每个存储服务都有自己独立的存储模块,是相互独立的。

每个存储服务都有一个业务访问模块和一个底层存储模块组成。

业务访问层隔离业务逻辑层和底层存储,提供基于RPC的数据访问接口;底层存储有两类:

  • SDB

  • MySQL

SDB 适用于以用户UIN(uint32_t)为Key的数据存储,比方说消息索引和联系人。

优点是性能高,在可靠性上,提供基于异步流水同步的 Master-Slave 模式,Master 故障时,Slave 可以提供读数据服务,无法写入新数据。

由于微信账号为字母+数字组合,无法直接作为 SDB 的 Key,所以微信帐号数据并非使用 SDB,而是用 MySQL 存储的。

MySQL 也使用基于异步流水复制的 Master-Slave 模式。

第 1 版的帐号存储服务使用 Master-Slave 各1台。

Master 提供读写功能,Slave 不提供服务,仅用于备份。

当 Master 有故障时,人工切读服务到 Slave,无法提供写服务。

为提升访问效率,我们还在业务访问模块中加入了 memcached 提供 Cache 服务,减少对底层存储访问。

第 2 版的帐号存储服务还是 Master-Slave各1台,区别是Slave可以提供读服务,但有可能读到脏数据,因此对一致性要求高的业务逻辑,例如注册和登录逻辑只允许访问Master。

当 Master有故障时,同样只能提供读服务,无法提供写服务。

第 3 版的帐号存储服务采用1个 Master 和多个 Slave,解决了读服务的水平扩展能力。

第 4 版的帐号服务底层存储采用多个 Master-Slave 组,每组由1个 Master 和多个 Slave 组成,解决了写服务能力不足时的水平扩展能力。

最后还有个未解决的问题:单个 Master-Slave 分组中,Master 还是单点,无法提供实时的写容灾,也就意味着无法消除单点故障。

另外 Master-Slave 的流水同步延时对读服务有很大影响,流水出现较大延时会导致业务故障。

于是我们寻求一个可以提供高性能、具备读写水平扩展、没有单点故障、可同时具备读写容灾能力、能提供强一致性保证的底层存储解决方案,最终 KVSvr 应运而生。

KVSvr 使用基于 Quorum 的分布式数据强一致性算法,提供 Key-Value/Key-Table 模型的存储服务。

传统 Quorum 算法的性能不高,KVSvr 创造性地将数据的版本和数据本身做了区分。

将 Quorum 算法应用到数据的版本的协商,再通过基于流水同步的异步数据复制提供了数据强一致性保证和极高的数据写入性能。

另外 KVSvr 天然具备数据的 Cache 能力,可以提供高效的读取性能。

KVSvr 一举解决了我们当时迫切需要的无单点故障的容灾能力。

除了第 5 版的帐号服务外,很快所有SDB底层存储模块和大部分MySQL底层存储模块都切换到KVSvr。

随着业务的发展,KVSvr 也不断在进化着,还配合业务需要衍生出了各种定制版本。

现在的 KVSvr 仍然作为核心存储,发挥着举足轻重的作用。

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
继“Java开发微信朋友圈PC版系统-架构1.0”之后,debug这段时间日撸夜撸,终于赶在春节放假前给诸位带来了这一系统的架构2.0版本,特此分享给诸位进行学习,以掌握、巩固更多的技术栈以及项目和产品开发经验,同时也为即将到来的金三银四跳槽季做准备! 言归正传,下面仍然以问答的方式介绍下本门课程的相关内容! (1)问题一:这是一门什么样的课程? 很明显,本门课程是建立在架构1.0,即 第1门课程 的基础上发布的,包含了架构1.0的内容,即它仍然是一门项目、产品实战课,基于Spring Boot2.X + 分布式中间件开发的一款类似“新浪微博”、“QQ空间”、“微信朋友圈”PC版的互联网社交软件,包含完整的门户网前端 以及 后台系统管理端,可以说是一套相当完整的系统! (2)问题二:架构2.0融入了哪些新技术以及各自有什么作用? 本课程对应着系统架构2.0,即第2阶段,主要目标:基于架构1.0,优化系统的整体性能,实现一个真正的互联网社交产品;其中,可以学习到的技术干货非常多,包括:系统架构设计、Spring Boot2.X、缓存Redis、多线程并发编程、消息中间件RabbitMQ、全文搜索引擎Elastic Search、前后端消息实时通知WebSocket、分布式任务调度中间件Elastic Job、Http Restful编程、Http通信OKHttp3、分布式全局唯一ID、雪花算法SnowFlake、注册中心ZooKeeper、Shiro+Redis 集群Session共享、敏感词自动过滤、Java8 等等; A.  基于Elastic Search实现首页列表数据的初始化加载、首页全文检索;B.  基于缓存Redis缓存首页朋友圈“是否已点赞、收藏、关注、评论、转发”等统计数据;整合Shiro实现集群部署模式下Session共享;C.  多线程并发编程并发处理系统产生的废弃图片、文件数据;D.  基于Elastic Job切片作业调度分布式多线程清理系统产生的废弃图片;E.  基于RabbitMQ解耦同步调用的服务模块,实现服务模块之间异步通信;F.  基于WebSocket实现系统后端 与 首页前端 当前登录用户实时消息通知;G.  基于OKHttp3、Restful风格的Rest API实现ES文档、分词数据存储与检索;H.  分布式全局唯一ID 雪花算法SnowFlake实现朋友圈图片的唯一命名;I.  ZooKeeper充当Elastic Job创建的系统作业的注册中心;J.  为塑造一个健康的网络环境,对用户发的朋友圈、评论、回复内容进行敏感词过滤;K.  大量优雅的Java8  Lambda编程、Stream编程;  (3)问题三:系统运行起来有效果图看吗?
微信是一款非常流行的社交软件,是中国移动互联网领域的一颗明珠。微信架构主要由客户端、服务器数据库三部分组成,今天我们来详细了解一下微信的软件架构。 一、客户端架构 微信的客户端主要分为Android、iOS、Windows Phone和Web四个部分。其中Android和iOS占据了市场的绝大部分,Windows Phone和Web的用户较少。 1. Android客户端 Android客户端的架构主要由Activity、Service、BroadcastReceiver和ContentProvider四个组件构成。Activity是用户界面的载体,负责展示界面和处理用户的交互事件;Service负责在后台执行任务,如音乐播放和推送消息等;BroadcastReceiver负责接收系统和应用的广播消息,如网络状态变化和电池电量低等;ContentProvider则负责对外提供数据访问的接口。 2. iOS客户端 iOS客户端的架构主要由ViewController、View、Model和Network四个部分组成。ViewController是用户界面的载体,负责展示界面和处理用户的交互事件;View负责展示数据,如TableView和CollectionView等;Model负责数据的存储和处理,如本地化存储和网络请求等;Network则负责网络通信,如Socket和HTTP等。 3. Windows Phone客户端 Windows Phone客户端的架构主要分为View、ViewModel和Model三个部分。View是用户界面的载体,负责展示界面和处理用户的交互事件;ViewModel则负责将View和Model连接起来,负责用户交互和数据处理的逻辑;Model则负责数据的存储和处理,如本地化存储和网络请求等。 4. Web客户端 Web客户端的架构主要由HTML、CSS和JavaScript三个部分组成。HTML负责页面的结构,CSS负责页面的样式,JavaScript负责页面的交互和数据处理。 二、服务器架构 微信服务器架构主要分为应用服务器、消息服务器和文件服务器三个部分。 1. 应用服务器 应用服务器主要负责处理微信的业务逻辑,如用户注册、登录、聊天等。应用服务器主要分为Web服务器和应用服务器两个部分。Web服务器负责接收用户请求,如登录和注册等;应用服务器则负责处理请求,如验证用户信息和推送消息等。 2. 消息服务器 消息服务器主要负责消息的传输和存储。消息服务器主要分为IM服务器和Push服务器两个部分。IM服务器负责实现即时通讯的功能,如聊天、语音和视频等;Push服务器则负责推送消息,如推送系统通知和好友消息等。 3. 文件服务器 文件服务器主要负责文件的存储和传输。文件服务器主要分为图片服务器、音频服务器和视频服务器三个部分。图片服务器负责存储用户上传的图片,如头像和聊天图片等;音频服务器则负责存储用户上传的音频,如语音消息和歌曲等;视频服务器则负责存储用户上传的视频,如视频聊天和短视频等。 三、数据架构 微信数据架构主要分为关系型数据库和非关系型数据库两个部分。 1. 关系型数据库 关系型数据库主要负责存储用户的基本信息,如用户的ID、昵称和性别等。关系型数据库主要分为MySQL和Oracle两种。 2. 非关系型数据库 非关系型数据库主要负责存储用户的聊天记录和其他一些非结构化数据。非关系型数据库主要分为MongoDB和Redis两种。 四、总结 微信的软件架构主要由客户端、服务器数据库三部分构成。客户端主要分为Android、iOS、Windows Phone和Web四个部分,服务器主要分为应用服务器、消息服务器和文件服务器三个部分,数据库主要分为关系型数据库和非关系型数据库两个部分。微信的软件架构设计合理,各个组件之间相互配合,使得微信能够快速响应用户的需求,为用户提供更好的服务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值