数据分析
文章平均质量分 55
梨子串桃子
有空就写点东西
展开
-
AdaBoost算法详解自用笔记(1)二分类问题举例分析
AdaBoost作为一种提升方法,其需要回答两个问题:一是每一轮如何改变训练数据的权重或概率分布;二是如何将弱分类器组合成一个强分类器。对于第一个问题,AdaBoost的做法是**提高那些被前一轮弱分类器错误分类样本的权重,而降低那些被正确分类样本的权重**,这样一来那些没有得到正确分类的数据,由于权重被增大后,将在下一轮的弱分类器中被给予更大关注。对于第二个问题,AdaBoost的做法是**采取多数表决的方式,加大分类误差率小的弱分类器的权重,减小分类误差率大的弱分类器的权重**,这样一来使得分类误差率小原创 2024-04-01 18:14:47 · 865 阅读 · 0 评论 -
数据分析 | Lasso回归之前绘制岭迹图确定交叉验证选择最佳alpha的搜索范围
数据分析 | Lasso回归之前绘制岭迹图确定交叉验证选择最佳alpha的搜索范围原创 2024-02-18 01:00:35 · 165 阅读 · 0 评论 -
数据分析 | 手敲皮尔逊相关系数计算代码 | Python
数据挖掘 | 手敲皮尔逊相关系数计算代码 | Python原创 2024-02-16 02:52:58 · 143 阅读 · 0 评论 -
数据分析 | 选择最佳的Stacking堆叠模型、单层结构双层结构 | Python代码
单层Stacking结构,基学习器为:朴素贝叶斯、随即下降、随机森林、决策树、AdaBoost、GBDT、XGBoost,7个任选3个作为基学习器组合,Meta函数固定为MLP。原创 2024-01-17 11:59:23 · 790 阅读 · 2 评论 -
数模实操演示|投影寻踪法评价十支最值得购买的股票
建立无监督指标、正向化归一化、投影寻踪、模拟退火原创 2023-05-06 16:58:37 · 217 阅读 · 1 评论 -
数据分析 | 频率编码和标签编码 | Python代码
数据集见GitHub链接:https://github.com/ChuanTaoLai/Frequency-Encoding-And-Label-Encoding原创 2023-12-11 22:40:39 · 442 阅读 · 0 评论 -
数据分析 | 离散型数据的类别转换 | Python代码
数据集见GitHub连接:https://github.com/ChuanTaoLai/Corresponding_category_conversion原创 2023-12-11 22:37:59 · 351 阅读 · 0 评论 -
数据分析 | 特征重要性分析 | 树模型、SHAP值法
本文基于集成学习的方法介绍另外两种可以分析特征重要性的方法:树模型、SHAP值法。原创 2023-08-28 22:10:21 · 3161 阅读 · 6 评论 -
数据分析 | Boosting与Bagging的区别
Boosting与Bagging的区别原创 2023-08-17 23:31:59 · 894 阅读 · 1 评论 -
数据分析 | 调用Optuna库实现基于TPE的贝叶斯优化 | 以随机森林回归为例
数据分析 | 调用Optuna库实现基于TPE的贝叶斯优化 | 以随机森林回归为例原创 2023-08-16 23:31:40 · 1668 阅读 · 1 评论 -
数据分析 | 随机森林如何确定参数空间的搜索范围
极其重要的三个超参数是必须要调整的,一般再加上两到三个其他超参数进行优化即可。只需在输出的最小值和最大值之间进行搜索即可。原创 2023-08-13 18:53:11 · 497 阅读 · 1 评论 -
数据分析 | 为什么Bagging算法的效果优于单个评估器
1.回归问题如何降低方差2. 分类问题如何降低方差3. Bagging有效的条件原创 2023-08-12 15:13:37 · 147 阅读 · 1 评论