西瓜书学习计划-1

西瓜书CH1-2

CH1 定义与概念

分类:预测离散值
回顾:预测连续值

无监督学习:
有监督学习:

泛化能力:模型适用于新样本的能力;

奥卡姆剃刀原理:称为“如无必要,勿增实体”,即“简单有效原理”。

CH2 评估与选择

混淆矩阵,错误率与精度;需要在过拟合和欠拟合之间找到平衡点。

评估方法

通过测试集,来测试学习器对新样本的判别能力,以测试集上的测试误差作为泛化误差的近似。下面给出两个划分测试集的方法:

留出法(hold_out)

直接将数据集D划分为两个互斥的集合;在划分中尽量保持数据分布的一致性,即保留类别比例,可用分层采样的方式。由于划分方式的不同,评估结果会千差万别,所以需要多次进行随机划分,重复得出评估值。
另外,对于测试集的划分,常见做法是大约2/3或4/5作为训练,剩余样本作为测试。

交叉验证法(cross validation)

将数据集划分为k个大小相似的互斥子集,通过分层采样;然后将k-1个子集的并集作为训练集,剩余作为测试集;这样可以进行k次训练和测试,最终评估结果取这k次的均值。通常又称为,k折交叉验证。k最常用的取值是10,其他也用5、20等。<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值