1、数据量和模型选择
2、开发集和测试集(开发集和测试集应该服从同一分布)
3、优化指标和满意度指标
这一点很重要,有时候我们关注的往往有多个指标,而指标之间又相互制约,所以需要固定下一个指标或者确定一个有效范围,在此特定情况下不断优化,不断迭代!
4、通过开发集和度量指标,加速迭代
这一点是以上和核心,即 训练前优先确定固定的优质测试集和度量指标
经常遇到的一个问题是测试集可能也暂时不达标,那么可以先使用目前测试集进行测试,并优先修正或者标注有问题的测试数据,然后逐步迭代对比,达到逐步优化的效果
5、何时修改开发集、测试集和指标
小结:
作为实际开展过项目和调参的,一定知道书中句句精华(感谢吴恩达老师)
强烈推荐阅读,需要的可以留下邮箱私发