《机器学习基石》---三个有用的机器学习原则

1 奥卡姆剃刀原则

使用模型时尽量使用简单的模型。从简单的模型开始做起。

 

2 避免抽样偏差

所谓抽样偏差,是指训练数据集和测试数据集不是由同一个分布产生的。

比如验证集是从训练集中随机取一部分得到的,但是测试集却是时间轴靠后的数据,这样即使在验证集上做的很好,测试的时候却可能没那么好。

VC理论中,一个前提就是训练集和测试集要来源于同一个分布。因此抽样偏差将导致VC理论失效:

因此我们实际中要尽量使我们的训练集与测试集的分布接近。

 

3 避免数据窥探

 

 

转载于:https://www.cnblogs.com/coldyan/p/6397467.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值