Q:项目A,在线上运营的App版本在tga后台突然间无法收到数据,很奇怪,上线时正常的版本,为什么突然间出问题了呢?
第一步澄清问题:
1、一样的版本,之前tga可以收到数据,现在tga突然无法收到
第二步 分析问题:
2、tga的数据是如何上报的? 定义的事件如何触发了,就给向指定的地址上报数据。
第三步 提出假设
a、核查其他项目,是否同样也收不到数据,来确定是单个项目的问题,还是tga后台的问题
b、上报的数据地址是否出现了问题。
第四部:校验,得出结论
对第三步列出的假设,一一进行校验,判定。最后发现是数据上报的地址出现了问题。
tga的数据库进行了迁移,导致原来的旧地址访问不同,而app里配置的地址还是旧地址。数据库的迁移在2个月之前已经通知,当时是在一个群里以流水信息的方式通知了大家,@的责任人口头答应,并没有落实,负责的研发人员没有被@,变动的消息也被刷屏没有看到。。再加上数据库并没有立马进行分割迁移,导致这个问题被搁浅没有暴露出来。另外这次数据库迁移也默认都做好调整,没有另行通知大家核查数据地址是否调整,而是直接做了迁移,就导致了现在的问题。
这里面暴露出三个问题:
1、任务发起,采用了流水消息的形式。
2、任务发起,责任人知晓,但是因为种种原因没有落实,同时没有问题倒逼,就导致任务不了了之,最后大爆发;
3、在进行删除、修改重大操作之前,需要通知大家再核查一下,避免出现问题。
如何规避问题
1、发起任务时,在jira平台录入一条数据,状态流转。
2、创建一个todoList,定期的去查看待办事项,挑选优先级高的去解决,同时也记录有哪些任务,不容易被遗忘。
3、有较大改动时,一定在通知干系人。
解决方案
线上版本出问题了,着急的像热锅上的蚂蚁。解决方案能有啥,就只能重新打一个新的版本上线了。咨询了boss和数据组,最后决定不重新发版。因为现在app处在推广阶段,需要收集、分析的数据已经够了,丢失的数据不会有太大的影响,地址在下个版本调整过来就可以。
通过这个事情,让我意识到:当遇到自认为很严重、着急的事情时,不要慌张失措,要跳出来评估这个事情真的如你所认为的严重吗?!或许不是!
当然这是因为情况特殊,app的量还不是很大,如果是在量起来之后出现了这个问题,后果真的是不敢设想。版本质量还是要慎重对待。