机器学习策略

评价指标

这里写图片描述

查准率(precision)和查全率(recall)

翻译很贴近它要表达的意思
恩达举的例子
查准率的定义是在你的分类器标记为猫的例子中,有多少真的是猫。所以如果分类器A有95%的查准率,这意味着你的分类器说这图有猫的时候,有95%的机会真的是猫

查全率就是,对于所有真猫的图片,你的分类器正确识别出了多少百分比。实际为猫的图片中,有多少被系统识别出来?如果分类器A查全率是90%,这意味着对于所有的图像,比如说你的开发集都是真的猫图,分类器A准确地分辨出了其中的90%。

当我们使用这两个指标不能很好判断一个模型的好坏,我们就要使用f值去判断,你可以把它看做这两个指标的一个均值,当然这不是严格意义上的均值。

训练/开发/测试集划分(Train/dev/test distributions)

training set:顾名思义,是用来训练模型的。因此它占了所有数据的绝大部分。
development set:用来对训练集训练出来的模型进行测试,通过测试结果来不断地优化模型。
test set:在训练结束后对训练出的模型进行一次最终的评估所用的数据集。

所有数据随机洗牌,放入开发集和测试集,保证我们的数据来自于同一个分布。

开发集和测试集大小的划分

小数据集(几千个样本或者有一万个样本):训练集、测试集三七分;训练集、开发集和测试集六六二

大数据集(百万级):98%作为训练集,1%开发集,1%测试集

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值