超参数优化

优化超参数时,首先的选中影响最重要的那些下手,因为超参数有很多,每个都优化的话会花费大量时间,并且得理解这些超参数是怎么影响模型的在这里插入图片描述
下面是一些超参数优化的库
在这里插入图片描述
我们大概可以把超参数分为两种类型,一种是当值越大时,对模型限制越严格,也就是减低过拟合的可能,一种是值越大时,是模型拟合能力越强,越容易过拟合
在这里插入图片描述

tree-based models

在这里插入图片描述
在这里插入图片描述
max_depth [default=6]:数的最大深度,值越大,树越复杂,默认值6,典型值3-10

subsample[default=1]:采样率,0到1之间,选取样本的一定百分比作为训练集,如果设成0.8,即随机选择样本80%训练

colsample_bytree [default=1]:构造每棵树时,特征采样率,即选取多少特征

colsample_bylevel [default=1]:每执行一次分裂,列采样率,这个一般很少用

min_child_weight [default=1]:定义了一个子集的所有观察值的最小权重和,控制树分裂到某个程度就不再分裂,这个可以用来减少过拟合,但是过高的值也会导致欠拟合,因此可以通过CV来调整min_child_weight

lambda [default=1, alias: reg_lambda]:L2正则化

alpha [default=0, alias: reg_alpha]:L1正则化,这个主要是用在数据维度很高的情况下,可以提高运行速度

eta [default=0.3, alias: learning_rate]:学习率,典型值一般设置为:0.01-0.2

num_round:运行训练的轮数

seed [default=0]:随机数的种子,缺省值为0,可以用于产生可重复的结果(每次取一样的seed即可得到相同的随机划分)

随机森林:
在这里插入图片描述
神经网络:
在这里插入图片描述
Linear models:
在这里插入图片描述
在这里插入图片描述
Tips:
在这里插入图片描述

Practical guide在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Pipeline guide

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值