http://www.52im.net/thread-921-1-1.html
微信客户端团队负责人技术访谈:如何着手客户端性能监控和优化
前言一款产品能否与用户产生化学反应,客户端在这一过程中的性能作用最关键。启动时间太长、内存消耗太大、ANR 等等,都会直接影响用户对一款应用的判断和使用体验。 如微信 Slogan 说的那样:微信,是一个生活方式。所以,微信 App 本身就包含非常多且复杂度高的业务模块(如搜索、视频等),也接入了很多第三方的插件,这势必会拖慢应用的启动时间和响应速度,尤其是目前出现了“微信重度用户”这一现象,迫使微信追求更多的分析和优化措施。 在由听云联合极客邦科技 /InfoQ 共同主办的 APMCon 2017 会议上,我们邀请微信“小黑屋 11 人”之一的微信客户端开发团队负责人陈岳伟(Lylechen)来 APMCon 现场分享“微信重度⽤户体验的优化之道”。InfoQ 对陈岳伟进行了会前采访,简单了解了微信在客户端性能监控和优化做了哪些工作。 访谈嘉宾![]() - 微信客户端开发团队负责人,统筹微信在 iOS、Android、Mac 和 Windows 等平台的开发管理工作; - 2010 年加入微信团队,从无到有构建出微信的第一个 iOS 版本,并持续不断进行架构优化和性能稳定性打磨; - 近年来主要关注微信终端监控体系以及微信重度用户的性能提升和体验优化。 访谈内容1请介绍一下,微信 iOS 客户端第一个版本开发花了多长时间,在性能上有哪些关注点?陈岳伟:第一个 iOS 和 Android 微信版本均花了 2 个月左右的开发时间。初期阶段主要集中在功能开发上,对性能没有特别花太多时间关注,主要对于启动速度、消息收发等主场景做了压力测试。对于一个初创的产品,微信研发团队更看重版本的快速迭代,“先迭代再优化”是第一原则。(相关文章《开发往事:记录微信3.0版背后的故事(距微信1.0发布9个月时)》、《开发往事:深度讲述2010到2015,微信一路风雨的背后》) 2目前微信客户端有哪些维度的性能监控,侵入性如何,对性能有何影响?陈岳伟:目前微信客户端的性能监控纬度,主要包含 Crash、卡顿、耗时、内存、SQLite、安装包大小、网络性能等。 微信研发团队所做的监控系统可以分为两类:一类是通用监控,一类是专项监控。 针对通用监控,团队搭建了一套基于简单数值上报的终端实时监控系统,可以覆盖几乎所有的监控纬度,最终呈现出来的是 PV、UV、耗时分布、错误统计等。比如准实时生成客户端启动次数、Crash 次数、网络调用次数等曲线,最少延迟可以做到 10 分钟以内。 通用监控主要用于快速发现问题,而其定位问题的能力相对较弱,于是构建了多个专项监控系统。举个例子,微信团队构建的卡顿监控系统,不仅可以监控客户端卡顿次数,还可以展示卡顿堆栈分类和排序,部分场景还可以做到精确标示函数调用的耗时分布。当然专项监控的上报延时更长,数据计算也比较复杂,目前能做到“小时~天”的级别,主要起分析定位的作用。 大部分监控以手动埋点、框架性自动埋点以及触发式上报为主,对性能影响很小。SQLite 和耗时监控,涉及较细力度的插桩,会有一定的性能损耗,前者主要用于开发和自动化测试阶段,后者对现网用户做了一定的采样。 相关文章请见《移动端IM实践:iOS版微信界面卡顿监测方案》、《移动端IM实践:Android版微信如何大幅提升交互性能(一)》、《移动端IM实践:Android版微信如何大幅提升交互性能(二)》。 3微信客户端在性能上有哪些优化点?陈岳伟:针对微信客户端的性能优化,主要分为网络、UI、内存、存储等四大模块。
4微信客户端目前开发了哪些跨端组件,是否均使用 C/C++ 开发?陈岳伟:目前主要有两大跨平台组件,包括 Mars 组件(COMM、XLOG、SDT、STN,详见 Mars 介绍)和 WCDB 组件。其中 Mars 全部使用 C/C++ 开发,可适用于 iOS、Android、Windows 和 Mac 等平台;而 WCDB 主要根据 iOS(MacOS)和 Android 两个平台提供了不同的语言适配,但底层的 SQLite 源码优化和 RepairKit,还是继续采用 C/C++ 开发。 微信的移动端数据库组件WCDB和移动端IM网络层跨平台组件库Mars都已开源,开源代码和资料托管等详见《[资讯] 微信正式开源移动端数据库组件WCDB!》、《如约而至:微信自用的移动端IM网络层跨平台组件库Mars已正式开源》 。 5微信 iOS 端在 WebView 上做了哪些优化,有哪些性能监控点?陈岳伟:iOS 端的 WebView 主要做了资源预加载与缓存、视频代理与下载策略优化、图片代理与编码优化等,针对 WebView 安全和微信特有的 JS SDK 也有一系列的优化策略。 目前微信绝大部分 WebView,均已替换为 WKWebView,在内存占用和稳定性上有很大的提升。性能监控点,主要包含各阶段耗时分布、相关错误码分类和内存 OOM 监控。 6针对重度用户的体验优化是从什么时候开始的?当时的出发点是什么?到目前主要做了哪些工作,有什么规划?陈岳伟:从 2015 年底开始,当时出发点是 DB 损坏率极速上升,以及用户存储空间快速增长;目前主要对 DB 损坏、内存 OOM 和存储架构等做部分优化工作,前两者会在 APMCon 给大家做详细分享;后续希望对重度用户大盘进行更精确的监控和分析,提升问题发现和定位能力。(《微信团队原创分享:微信客户端SQLite数据库损坏修复实践》一文详细介绍了相关技术实践) |