低概率事件在样本量足够大时总会出现

近期产品又有1个概率问题,被生产部门同事升级,被领导狠批;从9月底前至今一直进行测试这个版本,希望能发布后平息生产加工的声音;问题的背景大概是这样的,前期在实验室测试中有个小概率超时问题,可能造成一个生产装备测试项目FAIL,大概测试3~5次偶然出现1次,对应的生产测试中也有个操作规范,也有遇到1次失败后可以重测的机制,在研发内部评估认为可以接受,和生产接口也知会了这个问题,让他们接受重测的要求;但是版本发布后,随着产线上的订单增加,版本生效后产线上每日多个单板测试中遇到这个问题(超时问题),造成生产同事多数单板要测试3,5次才可以通过发货,严重影响生产加工效率,进而问题被升级投诉;研发紧急加班进行处理,可是然而加班转测试的新版本也没有那么顺利,昨天又有1个单板测试出现概率失败问题,目前测试20余次中只出现了一次;版本经理迫于交付压力,想把没有出现问题的其他单板先发布出去,和这个单板配合出现的问题继续分析定位;在评估影响环节,还是想说服我同意版本发布,我的建议能明确只在这个组合或这个单板的情况下才同意其他单板发货,如果不能确认需要继续复现定位分析,几位开发同事反复说服我同意,故建议拉产线代表沟通,产线代表经过上次事件后,明确表示要有明确结论,才可以发布,如果是共性问题在生产的加工量上一定会再次遇到,最终版本没有发布继续分析定位。

本次事件有3点心得供后续交付中参考:

1. 小概率事件总会发生:就好比中彩票,总会有人遇到。在实验室测试中,样本量总是少数的,哪怕经过反复的测试,出现的低概率问题,到了生产和网上,成千上万的基数下就会被放大成为1个必然问题,都有可能引起客户对产品质量的质疑。

2. 问题评估影响时要对问题有影响的当事人参与:一些问题从研发视角往往会忽视问题的真实影响。

3. 一次性把事情做对的效率最高:第一次发布时心存侥幸,希望能够通过人为复测,消除问题影响,大概用了1周时间;本次产线出了问题后,前后已经投入近1个月,看似争取了时间,实际投入却翻了3倍不止。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值