CatBoost原理及应用

最新推荐文章于 2024-04-10 11:57:21 发布

奥瑞给给~~

最新推荐文章于 2024-04-10 11:57:21 发布

阅读量381

点赞数

分类专栏：机器学习文章标签：决策树机器学习人工智能

原文链接：https://mp.weixin.qq.com/s/c3Bfcx3CwW8KgRT1LC7eFQ

版权

机器学习专栏收录该内容

26 篇文章 8 订阅

订阅专栏

CatBoost原理及应用

集成学习：为了获得更好的预测性能，集成学习结合多个模型（弱学习器）的预测结果。它的策略就是大力出奇迹，因为弱学习器的有效组合可以生成更准确和更鲁棒的模型。集成学习方法分为三大类：

Bagging：该技术使用随机数据子集并行构建不同的模型，并聚合所有预测变量的预测结果。
Boosting：这种技术是可迭代的、顺序进行的和自适应的，因为每个预测器都是针对上一个模型的错误进行修正。
Stacking：这是一种元学习技术，涉及结合来自多种机器学习算法的预测，例如 bagging 和 boosting。

CatBoost（categorical boosting）是一种能够很好地处理类别型特征的梯度提升算法库。CatBoost 和 XGBoost、LightGBM 并称为 GBDT 的三大主流神器。

CatBoost 的主要特点：对称树
与 XGBoost 和 LightGBM 不同，CatBoost 构建对称（平衡）树。在每一步中，前一棵树的叶子都使用相同的条件进行拆分。选择损失最低的特征分割对并将其用于所有级别的节点。这种平衡的树结构有助于高效的 CPU 实现，减少预测时间，模型结构可作为正则化以防止过度拟合。
在对称决策树中，只使用一个特性来构建每个树级别上的所有分支。共有三种类型的拆分：FloatFeature、OneHotFeature 、OnlineCtr。

CatBoost 的基本使用

Pool是catboost中的用于组织数据的一种形式，也可以用numpy array和dataframe。但更推荐Pool，其内存和速度都更优。

整理ipynb文件参见此处

参考文献：
python数据科学

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
CatBoost原理及应用

CatBoost原理及应用
复制链接

扫一扫

专栏目录

奥瑞给给~~ CSDN认证博客专家 CSDN认证企业博客

码龄4年

40: 原创

40万+: 周排名

153万+: 总排名

13万+: 访问

: 等级

688: 积分

35: 粉丝

101: 获赞

15: 评论

572: 收藏

私信

关注

热门文章

分类专栏

最新评论

英文写作—Grammarly安装及下载
Flores_X: 同我也没找着
英文写作—Grammarly安装及下载
m0_63171456: -take a quick tour这个没有啊
Python进行相关分析
2301_79650442: import pandas as pd import numpy as np from sklearn.datasets import load_iris from scipy.stats import pearsonr X=load_iris().data #1 使用numpy来求皮尔森相关系数 #rowvar=False时计算的是列与列之间(即随机变量)的相关性 result_1=np.corrcoef(X,rowvar=False) #2 使用pandas中corr()来计算相关性 result_2=pd.DataFrame(X).corr() #3 按照皮尔森计算公式来求 result_3=np.zeros((X.shape[1],X.shape[1])) for i in range(X.shape[1]): for j in range(X.shape[1]): std_i,std_j=np.std(X[:,i]),np.std(X[:,j]) cov_ij=np.mean(X[:,i]*X[:,j])-X[:,i].mean()*X[:,j].mean() result_3[i,j]=cov_ij/(std_i*std_j) #4 使用scipy.stats.pearsonr来实现。该函数不仅返回相关系数，还会返回p-value值。 result_4=np.zeros((X.shape[1],X.shape[1])) for i in range(X.shape[1]): for j in range(X.shape[1]): result_4[i,j],_=pearsonr(X[:,i],X[:,j])
PyCharm——ModuleNotFoundError: No module named ‘matplotlib‘ 解决办法
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/7979385, 请多输出高质量博客, 帮助更多的人
和弦图制作
liaokiki: 想请教一下，制作出来的和弦图，其标签有显示不完整的情况，如何调整呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。