模型调参——二手车价格预测

最新推荐文章于 2024-05-11 16:54:24 发布

homer_of

最新推荐文章于 2024-05-11 16:54:24 发布

阅读量206

点赞数

分类专栏：数据竞赛文章标签：机器学习 python

本文链接：https://blog.csdn.net/homer_of/article/details/116005473

版权

数据竞赛专栏收录该内容

7 篇文章 0 订阅

订阅专栏

模型调参——二手车价格预测

一、调参

调参的目标

调参就是对模型的参数进行调整，以找到使模型性能最优的参数。调参的目的就是达到使偏差和方差的大和谐。
参数可分为两类：过程影响类参数和子模型影响类参数。调整子模型数、学习率等参数，改变训练过程，可以提高整体模型的性能。
bagging的训练过程旨在降低方差，boosting的训练过程旨在降低偏差，过程影响类的参数能够引起整体模型性能的大幅度变化。
我们可以通过学习曲线来判断模型的性能是否得到提升。
假设模型是一个多元函数F，其输出值为模型的准确度。我们可以固定其他参数，从而对某个参数对整体模型性能的影响进行分析：是正影响还是负影响，影响的单调性？　　对Random Forest来说，增加“子模型数”（n_estimators）可以明显降低整体模型的方差，且不会对子模型的偏差和方差有任何影响。模型的准确度会随着“子模型数”的增加而提高。由于减少的是整体模型方差公式的第二项，故准确度的提高有一个上限。在不同的场景下，“分裂条件”（criterion）对模型的准确度的影响也不一样，该参数需要在实际运用时灵活调整。调整“最大叶节点数”（max_leaf_nodes）以及“最大树深度”（max_depth）之一，可以粗粒度地调整树的结构：叶节点越多或者树越深，意味着子模型的偏差越低，方差越高；同时，调整“分裂所需最小样本数”（min_samples_split）、“叶节点最小样本数”（min_samples_leaf）及“叶节点最小权重总值”（min_weight_fraction_leaf），可以更细粒度地调整树的结构：分裂所需样本数越少或者叶节点所需样本越少，也意味着子模型越复杂。一般来说，我们总采用bootstrap对样本进行子采样来降低子模型之间的关联度，从而降低整体模型的方差。适当地减少“分裂时考虑的最大特征数”（max_features），给子模型注入了另外的随机性，同样也达到了降低子模型之间关联度的效果。但是一味地降低该参数也是不行的，因为分裂时可选特征变少，模型的偏差会越来越大。在下图中，我们可以看到这些参数对Random Forest整体模型性能的影响：
[1]https://www.zhihu.com/question/34470160

homer_of

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
模型调参——二手车价格预测

模型调参——二手车价格预测一、调参调参的目标调参就是对模型的参数进行调整，以找到使模型性能最优的参数。调参的目的就是达到使偏差和方差的大和谐。参数可分为两类：过程影响类参数和子模型影响类参数。调整子模型数、学习率等参数，改变训练过程，可以提高整体模型的性能。bagging的训练过程旨在降低方差，boosting的训练过程旨在降低偏差，过程影响类的参数能够引起整体模型性能的大幅度变化。我们可以通过学习曲线来判断模型的性能是否得到提升。假设模型是一个多元函数F，其输出值为模型的准确度。我们可以固定
复制链接

扫一扫