![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
集成学习
文章平均质量分 85
zou_gr
在路上,在努力,在成长,
展开
-
集成学习(下)实战案例二——蒸汽量预测
背景介绍火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。锅炉的燃烧效率的影响因素很多,包括锅炉的可调参数,如燃烧给量,一二次风,引风,返料风,给水水量;以及锅炉的工况,比如锅炉床温、床压,炉膛温度、压力,过热器的温度等。我们如何使用以上的信息,根据锅炉的工况,预测产生的蒸汽量,来为我国的工业届的产量预测贡献自己的一份力量呢?所以,该案例是使用以上工业原创 2021-05-23 18:37:49 · 653 阅读 · 1 评论 -
集成学习(下)实战案例一——幸福感预测
背景介绍幸福感是一个古老而深刻的话题,是人类世代追求的方向。与幸福感相关的因素成千上万、因人而异,大如国计民生,小如路边烤红薯,都会对幸福感产生影响。这些错综复杂的因素中,我们能找到其中的共性,一窥幸福感的要义吗?另外,在社会科学领域,幸福感的研究占有重要的位置。这个涉及了哲学、心理学、社会学、经济学等多方学科的话题复杂而有趣;同时与大家生活息息相关,每个人对幸福感都有自己的衡量标准。如果能发现影响幸福感的共性,生活中是不是将多一些乐趣;如果能找到影响幸福感的政策因素,便能优化资源配置来提升国民的幸福感原创 2021-05-18 23:07:45 · 627 阅读 · 1 评论 -
集成学习(中)——基于Boosting方式的集成方法简单原理及代码实战(上)
Boosting概述怎么理解Boosting?我觉得我们可以从回答问题出发,解决这个问题。第一个是每一轮学习应该如何改变数据的概率分布?第二个是如何将各个弱分类器组合起来如Adaptive Boosting(Adaboost)和 Gradient Boosting(GBDT)及其变体Xgboost、LightGBM以及Catboost都是在采用不同的方法去解答这个问题。同时也声明本文不做详细的数学原理推导AdaboostAdaboost可谓是Boosting最经典的算法,对于Adaboos原创 2021-04-18 07:16:22 · 471 阅读 · 0 评论 -
集成学习(中)——投票法和bagging及代码实现
投票法讲bagging前就应该先谈到投票法,投票法是一种遵循少数服从多数原则的集成学习模型,通过多个模型的集成降低方差,从而提高模型的鲁棒性。举个例子,在预测泰坦尼克号的生死问题上,综合了logistics、Knn和决策树三个模型的预测结果,再决定出label的叫做投票。那么怎么综合这三个模型的预测结果便是关键问题了,第一种,直接使用预测的结果,如果三个模型中,一个预测死,两个预测生,那么便是生,这就是投票法的硬投票,第二种,使用模型预测的概率,可以做平均,也可以出现第四个模型讲三个模型的概率作为输入,再原创 2021-04-13 23:46:25 · 2851 阅读 · 2 评论 -
集成学习(上)三之优化模型基础
背景在前面我们已经基本了解了机器学习项目的选择模型大致流程,原创 2021-03-21 23:33:09 · 338 阅读 · 0 评论 -
集成学习(下)Stacking集成学习方法原理与实战
导言上次我们介绍了Blending算法的优缺点,而Stack算法的出现就是解决了Blending的缺点并进行改进。原理简单来说,Stacking就是当用初始训练数据学习出若干个基学习器后,将这几个学习器的预测结果作为新的训练集,来学习一个新的学习器。我们举个例子来具体感受Stacking处理问题的细节。(1)将所有数据集生成测试集和训练集(假如训练集为10000条,测试集为2500条),那么第一层会进行5折交叉验证(折数可以自己定),使用训练集中的8000条作为训练集,剩余2000行作为验证集。(原创 2021-05-13 10:48:04 · 1393 阅读 · 3 评论 -
集成学习(下) Blending集成学习算法原理和实战
导言Blending被称为简化版的Stacking,是属于集大成类的算法之一。我们通过原理和简单实战了解Blending是在做什么?原理学习方式(1) 将数据划分为大训练集和测试集,其中大训练集需要再次划分为小训练集和验证集(划分的比例取决于自己);(2) 创建第一层的多个模型,这些模型可以使同质的也可以是异质的;(模型的选择可以说是监督学习的任何模型都可以接受)(3) 使用大训练集训练步骤2中的多个模型,然后用训练好的模型预测验证集和测试集得到val_predict, test_predict原创 2021-05-11 22:07:25 · 914 阅读 · 1 评论