查问题日志思路
日常需要日志来反馈的地方:
①日常支撑日志
②发版异常日志
③开发自测日志
①日常支撑日志
针对日常系统运营人员等的问题,查问题的切入点
1、入参的参数内容,记录一套标准的入参参数内容与其做对比,看看是不是传过来的参数有问题
2、逻辑问题,针对具体的业务场景,找到对应的代码,查看是否因为缺少条件等导致业务逻辑不通
3、记录接口请求及响应的时间,查看是否存在调用超时等问题
4、前端缓存问题,可能存在相同操作,然后缓存导致出现异常的情况
搜索关键词:
日志号、订单号、时间、异常信息等
搜索命令:
grep + 关键词 +日志文件名
# 一般来说less命令中会更详细
less + 日志文件名
②发版异常日志
第一步:根据日志定位发版异常日志位置
1、异常行数
2、异常类型
第二步:根据定位的异常行数及异常类型,结合Git提交记录时间判断具体出错行数
第三步:对应的配套措施及解决方案
事前预防措施:
1、告警:可以及时发现异常问题,要针对可能出现的异常进行告警配置
2、灰度:针对关键链路,进行灰度发布,减少影响
3、已有场景自动化覆盖测试
4、报错日志详细打印
5、代码评审
事后可改进方面:
1、告警优化
2、日志打印细化:针对模糊不清的异常日志进行细化,减少误解
3、添加自动化覆盖测试场景,录入本次异常场景触发规则,用于以后测试
③开发自测日志
1、添加需要打印的日志,对于异常信息要完整打印
2、合理使用搜索命令
grep + 关键词 +日志文件名
less + 日志文件名
# tail:查看文件的末尾内容,可以用来看实时日志内容
tail +行数 + 日志文件名
3、自测完毕后删掉多余的日志,减少生产日志量
欢迎各位大佬在评论区交流~