集成学习笔记04 回归模型的评估及超参数调优

本文介绍了回归模型的超参数调优,包括参数与超参数的区别,详细讲解了网格搜索GridSearchCV和随机搜索RandomizedSearchCV的工作原理、sklearn中的实现方法及代码实战,强调了随机搜索在高维数据时的优势。
摘要由CSDN通过智能技术生成

集成学习笔记04 回归模型的评估及超参数调优

相关学习资料请参考datawhale

1.参数和超参数

在对模型调优过程中,我们会碰到参数和超参数的问题。简单来说,参数是我们能够通过算法优化出来的数,而超参数,则是无法通过算法优化算出来的数。

1.1 参数相关概念

模型参数是模型内部的配置变量,其值可以根据数据进行估计。

  • 进行预测时需要参数。
  • 它参数定义了可使用的模型。
  • 参数是从数据估计或获悉的。
  • 参数通常不由编程者手动设置。
  • 参数通常被保存为学习模型的一部分。
  • 参数是机器学习算法的关键,它们通常由过去的训练数据中总结得出 。

1.2 超参数相关概念

模型超参数是模型外部的配置,其值无法从数据中估计。

  • 超参数通常用于帮助估计模型参数。
  • 超参数通常由人工指定。
  • 超参数通常可以使用启发式设置。
  • 超参数经常被调整为给定的预测建模问题。
    所以,在模型调优过程中,我们调整的一般都是超参数。通过对超参数的调整,尽可能地使模型的性能最优。

2. 调参方法(超参数)

2.1 网格搜索GridSearchCV()

网格搜索,顾名思义,就是在由可选参数组成的网格中进行选择,每个网格对应不同的参数值组成的空间。网格搜索通过对每个网格中参数的值进行模型精度计算,最后选出最优的网格。
它基本是自动调参,但需要事先将参数输进去,才能给出最优化的结果和参数。但是这个方法适合于小数据集,一旦数据的量级上去了,很难得出结果。

2.1.1 sklearn中对应函数GridSearchCV()

class sklearn.model_selection.GridSearchCV(estimator, param_grid, scoring=None, fit_params=None, n_jobs=1, iid=True, refit=True, cv=None, verbose=0, pre_dispatch=‘2*n_jobs’, error_score=’raise’, ret

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值