前言
本篇继续我们的集成算法学习之旅。这次带来的是一家俄罗斯搜索引擎公司推出的集成学习算法:Catboost(官网[https://catboost.ai/])。名字中的cat代表着categorical,就是说它可以直接处理类别型的特征变量,而无须进行one-hot-encoding处理,这还真是相比于其它算法包的一个优点。此外,官方宣传的卖点还包括:简化的调参(默认的参数即可实现高质量的预测);对GPU的支持等。
如果有一直关注我们的系列文章,相信大家已经发现主流的算法包都会封装一套像sklearn那样的接口规范,使用起来已经毫无成本可言了。CatBoost也不例外。
Python + CatBoost
还是熟悉的配方,通过sklearn风格的接口可快速上手如下:
from sklearn.datasets import load_breast_cancer
X,y = load_breast_cancer(return_X_y = True