第11步 CatBoost

本文介绍了CatBoost算法,强调其对类别型特征的处理和防止过拟合的特点。通过导入数据、数据预处理、训练模型和预测测试集,展示了CatBoost在Python中的使用。在模型训练中,讨论了不加和加Categoricalfeatures选项的区别,并提到了参数调优的重要性。最后,文章通过混淆矩阵评估模型性能,指出是否指定分类特征的影响可能取决于具体数据集。
摘要由CSDN通过智能技术生成


前言

之前介绍了Xgboost、LightGBM,这一步介绍的是第三个基于GBDT改进的算法,CatBoost,全称大概是这个Gradient Boosting(梯度提升) + Categorical Features(类别型特征)。
那么,它有啥独特之处呢?
(1)从名字来看,“Categorical Features(类别型特征)”,所以它对分类型特征有自己独到的处理方法。省得我们我们在筛选变量的时候纠结于连续变量和分类变量的相关性。
(2)预测偏移处理,从而减少模型的过拟合。
(3)运算速度快,至少比Xgboost快得多。
具体怎么改良的,也不细说了,有兴趣的可以自行食用,网址:https://catboost.ai/。
我们直接上代码实战,继续SUV的例子:


一、导入库与数据

import numpy as np
import matplotlib.pyplot as plt
imp
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Jet4505

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值