一、现象
在工作中,在机器学习中,有时候会看到基学习器 跟 弱学习器,会容易混淆,所以整理一下
二、解决方案
在机器学习中,“基学习器”(Base Learner)和“弱学习器”(Weak Learner)是两个经常使用的概念,它们在提升方法(Boosting)和集成学习中扮演着重要的角色。尽管在日常语境中,这两个术语有时被交替使用,但它们在技术上有着细微的区别:
-
弱学习器(Weak Learner):
- 弱学习器是指那些只有比随机猜测略好的预测能力的模型,也就是说,它们的预测性能只是略优于纯粹的偶然。
- 在二分类问题中,一个弱学习器的准确率应略高于50%。
- 它们通常很简单,易于构建,但单独使用时性能有限。
-
基学习器(Base Learner):
- 基学习器是一个更通用的概念,它可以是弱学习器,也可以是强学习器(Strong Learner),即具有高预测性能的模型。
- 在提升方法中,基学习器通常指的是构成集成模型的单个模型,无论其性能如何。
- 基学习器可以是决策树、感知机、神经网络或其他任何类型的模型。
区别:
- 性能:弱学习器的性能门槛低于基学习器。基学习器可以是弱的也可以是强的,而弱学习器则明确指的是性能较差的模型。
- 角色:在提升方法中,弱学习器是构成整个集成的基础,通过串行组合多个弱学习器来构建一个强学习器。而基学习器则是集成模型中的单个模型,可以是提升方法中的一个组成部分,也可以是其他类型的集成学习算法中的组成部分。
在实际应用中,提升算法(如AdaBoost、GBDT、XGBoost等)通常使用弱学习器作为基学习器,因为提升方法的核心思想是通过迭代地关注之前模型错误预测的样本,来逐步提升模型的性能。如果使用的基学习器本身已经很强,那么提升的效果可能就不明显了。