文中提出,业界一般流程:例如识别猫
你的团队有很多ideas,比如说:
1.获取更多数据:收集更多猫咪的图片
2.收集更多各种各样的训练集:比如说,不寻常花色的猫咪、不寻常姿势的猫咪以及相机对应各种参数下的猫咪图片
3.通过多轮梯度下降迭代,花更多的时间训练算法
4.构建一个更大的神经网络,有更多的层/隐藏层/参数
5.尝试小一点的神经网络
6.尝试着使用正则化(如L2正则化)
7.修改神经网络的架构(激活函数、隐藏单元的数量等)
分析机器学习和深度学习:
可得:
-
训练大型的神经网络,效果如同上图的绿色曲线。
-
拥有海量的数据。
因此,有改进算法性能的跟可靠方式是(1)训练更大的网络(2)获得更多的数据
1. 谈谈验证(测试)集怎么选?
以真实场景数据最优(以你预料“现场”的样本分布为准)
PS:
如果你在打造一个模型预测上海范围的车牌,那你的验证集就应该多选择“沪”牌(哪怕你的数据集有许多外地车牌)。
验证集和测试集应该同分布,如果两者不同分布,集中注意在验证集上。
注意:单一的度量指标去优化模型(哪怕准确率和召回率都要考虑,也可以求个平均值,以平均值(F1 score)为目标):
2、如何构建有效的性能和错误分析机制 ?
注意力:重点关注集(eyeball dev set)