相关课件:https://download.csdn.net/download/haoyutiangang/10496676
1.1 为什么是 ML 策略
实践中优化深度学习模型的方法有好多种,应该如何抉择?
1.2 正交化
正交化: 一个维度做且只做一件事,各个维度相互独立,不影响其他维度做的事情。
比如电视条件:有调节高度的按钮,宽度的按钮,旋转的按钮,
色彩的按钮,亮度的按钮,每个按钮负责一件事情,不会影响其他按钮调节的维度,使分析更为简单。
监督学习模型中:
- 系统在训练集上表现的好
- 否则,使用更大的神经网络、更好的优化算法
- 系统在开发集上表现的好
- 否则,使用正则化、更大的训练集
- 系统在测试集上表现的好
- 否则,使用更大的开发集
- 在真实的系统环境中表现的好
- 否则,修改开发测试集、修改代价函数
1.3 单一数字评估指标
如果用多个指标去评估各个系统的表现,很难抉择,因为各有利弊。
应该尝试去设置一个合理的单一实数评估指标,所有系统都通过这一个指标来评估好坏,问题就会简单的多,迭代速度也会加快。
例如:
- 查准率(Precision):计算结果中 true 的个数除以计算结果的个数
查全率(Recall): 计算结果中true的个数除以全集中真实true的个数
F1 Score:查准率和查全率的调和平均数
F1_sorce=21precis