吴恩达英语版学习笔记
1 Machine Learning Strategy
2 How to use this book to help your team
3 Prerequisites and Notation
4 Scale drives machine learning progress
5 Your development and test sets
主要说训练数据,验证数据得到的算法模型在测试数据表现差一个原因是测试数据与前者不属于同一个数据分布,比如前者是网上图片质量高而测试数据是智能手机拍得像素不高光线不足等;如果实在找不到真实的数据,可以从网上的数据建模,但是不要假设训练和测试是同分布的。将所有的数据分为80%训练数据,20%测试数据是通用的做法前提是你最终要检测的数据跟你手里的数据是接近同一个分布
6 Your dev and test sets should come from the same distribution
测试数据和训练数据来自同一个分布,效果不好极大原因是过拟合 ;而不是同一个分布,原因不好确定
7 How large do the dev/test sets need to be
数据集万级别及以上比较好,没有特别准确比例
8 Establish a single-number evaluation metric for your team to optimize
模型建立完了要有个评价标准简单说了准确率,召回率,F_score
9 Optimizing and satisficing metrics
对于多类分类模型除了考虑准确率,运行时间,模型大小等指标组成的矩阵
10 Having a dev set and metric speeds up iterations
11 When to cha