主要思路
这应该是一个比较普适的处理问题的方法,确认目标,剖析问题,处理问题,检验结果。
首先,要分析这bad case,知道bad case产生的原因,只有知道病因才能对症下药。
确定这个case是否需要解决,即评估这个case的影响面,有多少相似的case存在,解决后收益有多大,毕竟我们需要把资源花在最有收益的地方。
提出解决方案并进行试验。
校验case是否解决,解决程度如何(其实有时候能解决一个问题的80%已经很不错了,不见得要完全搞定)
校验,这个解决方案有没有引入新的问题(一般要做回归测试)。
问题诊断
要处理bad case,首先是要知道bad case是怎么产生的,为什么会有这些问题,一般地,主要是下面这些原因。
数据标注就有问题。这点其实在现实应用下就很常见,本身标注样本就不太可能天衣无缝,而且其中还存在大量人类自己都很难说清楚的case,例如现在的“快乐”真的就是“快乐”吗,“快乐风男”对于队友来说可就不一定是快乐了吧,em,从这个例子对于没打过英雄联盟的人来说,根本不知打我讲啥对吧,这就对了