机器学习(周志华) 习题参考答案 第二章 模型评估与选择

  1. 数据集包含1000个样本,其中500个正例,500个反例,将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式。
    答:在保持样本均衡的前提下,正例和反例在训练和测试集中的数量相同。在正例中的采样结果为 C 500 150 C_{500}^{150} C500150,所以总的采样结果为 ( C 500 150 ) 2 {(C_{500}^{150})^2} (C500150)2
  2. 数据集包含100个样本,其中正反例各一半,假定学习算法所产生的模型是将新样本预测为训练样本数较多的类别(训练样本数相同时进行随机猜测),试给出用10折交叉验证法和留一法分别对错误率进行评估所得的结果。
    答:对于10折交叉验证,由于训练集中的正反样本数量相同,所以最后的错误率平均为50%;对于留一法,由于留出的一个恰好属于训练集中较少的一方,所以测试结果都是错误的,最后的平均错误率为100%。
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值