数据角度:
增加数据有利于降低过拟合和欠拟合。
模型角度:
让模型复杂度降低有利于降低过拟合,增加模型复杂度有利于降低欠拟合。
对应xgboost模型复杂度降低就是让每棵树小点,树的数量少点,增大惩罚系数,early stopping。复杂度提高相反。
对应随机森岭模型复杂度降低就是让每棵树小点,树的数量少点。复杂度提高相反。
抽样角度。目标也是让数据更多:
让每棵树的抽样样本增加,有利于减少欠拟合。
让每棵树的抽样特征减少,有利于减少过拟合。
数据角度:
增加数据有利于降低过拟合和欠拟合。
模型角度:
让模型复杂度降低有利于降低过拟合,增加模型复杂度有利于降低欠拟合。
对应xgboost模型复杂度降低就是让每棵树小点,树的数量少点,增大惩罚系数,early stopping。复杂度提高相反。
对应随机森岭模型复杂度降低就是让每棵树小点,树的数量少点。复杂度提高相反。
抽样角度。目标也是让数据更多:
让每棵树的抽样样本增加,有利于减少欠拟合。
让每棵树的抽样特征减少,有利于减少过拟合。