1、背景
异常发现-》异常排查-》修复
异常发现慢、异常定位慢、异常修复时间慢依赖前两个
异常发现慢是监控做的不好,
2、解决方法:
监控报警
crash监控占比37.5%,性能15%,业务异常占比30%,业务异常大多反馈客服,缺乏业务的异常监控,做的比较少
埋点插庄,获取函数名及其参数
动态补丁,lua,js不需要编译,app客户端打补丁
3、小概率异常、无有效日志异常
4、原有排查方式:发临时包、在线调试、QA复现都有很多弊端
5、排查异常的信息维度:
位置维度:用户操作路径、哪些页面,点击哪些按钮,记录异常发生时方法调用操作路径,记录访问页面,记录操作路径,
方法调用堆栈,提供没法看懂,改成自己记录方法,关注自身代码,编译器插庄,字节码插庄ASM记录
归因维度:当前对象this,方法入参
应用权限:举例子:定位依赖于定位权限
环境信息、方法对象this、方法参数、方法调用堆栈、用户操作路径、应用权限列表、网络状态、
技术挑战:用户操作路径