识别程序面对的总是复杂多样的情况,在做识别性能提高的过程中,会碰到各种各样的错误,有时给人一种“防不胜防”的感觉,对此,别无二法,只能是加强测试数据的收集和强化测试,但是,当我们面对一大堆错误时,会发现好些是随机性的错误,即这种错误往往只出现一次,很难重现,对于这类错误,若用特殊的方法(即治标不治本的方法)解决它,则算法不会有适应性,所以会出现这样的情况:虽然改了很多识别错误,但最终测试后识别率并未有提升。对于随机性错误,如下四点是较为可行的策略:
1、 优先解决大概率的错误,不纠缠于小概率的随机性强的错误;
2、 尽量从随机性的错误中发现普适性的错误,举一反三地去解决问题;
3、 适当地容忍随机性错误的产生,以免陷入算法的泥潭;
4、 强化测试,从离散的错误中归类、总结错误的产生,以发现产生错误的规律。
(这段时间在做识别算法性能提高,在这方面感悟较深,特拿出来与大家分享。)