文章目录
前言
之前介绍了Xgboost、LightGBM,这一步介绍的是第三个基于GBDT改进的算法,CatBoost,全称大概是这个Gradient Boosting(梯度提升) + Categorical Features(类别型特征)。
那么,它有啥独特之处呢?
(1)从名字来看,“Categorical Features(类别型特征)”,所以它对分类型特征有自己独到的处理方法。省得我们我们在筛选变量的时候纠结于连续变量和分类变量的相关性。
(2)预测偏移处理,从而减少模型的过拟合。
(3)运算速度快,至少比Xgboost快得多。
具体怎么改良的,也不细说了,有兴趣的可以自行食用,网址:https://catboost.ai/。
我们直接上代码实战,继续SUV的例子:
一、导入库与数据
import numpy as np
import matplotlib.pyplot as plt
imp