集成学习
文章平均质量分 87
大米2H
这个作者很懒,什么都没留下…
展开
-
集成学习-蒸汽量预测(DataWhale第二期)
集成学习案例二 (蒸汽量预测)背景介绍火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。锅炉的燃烧效率的影响因素很多,包括锅炉的可调参数,如燃烧给量,一二次风,引风,返料风,给水水量;以及锅炉的工况,比如锅炉床温、床压,炉膛温度、压力,过热器的温度等。我们如何使用以上的信息,根据锅炉的工况,预测产生的蒸汽量,来为我国的工业届的产量预测贡献自己的一份力量原创 2021-07-31 17:25:23 · 123 阅读 · 0 评论 -
集成学习-Stacking与Blending与泰坦尼克号特征工程(DataWhale第二期)
1. 导言在前几个章节中,我们学习了关于回归和分类的算法,同时也讨论了如何将这些方法集成为强大的算法的集成学习方式,分别是Bagging和Boosting。本章我们继续讨论集成学习方法的最后一个成员–Stacking,这个集成方法在比赛中被称为“懒人”算法,因为它不需要花费过多时间的调参就可以得到一个效果不错的算法,同时,这种算法也比前两种算法容易理解的多,因为这种集成学习的方式不需要理解太多的理论,只需要在实际中加以运用即可。 stacking严格来说并不是一种算法,而是精美而又复杂的,对模型集成的一种原创 2021-07-28 22:10:42 · 569 阅读 · 0 评论 -
集成学习-Boosting与Adaboost与前向分布(DataWhale第二期)
2. Boosting方法的基本思路在正式介绍Boosting思想之前,我想先介绍两个例子:第一个例子:不知道大家有没有做过错题本,我们将每次测验的错的题目记录在错题本上,不停的翻阅,直到我们完全掌握(也就是能够在考试中能够举一反三)。第二个例子:对于一个复杂任务来说,将多个专家的判断进行适当的综合所作出的判断,要比其中任何一个专家单独判断要好。实际上这是一种“三个臭皮匠顶个诸葛亮的道理”。这两个例子都说明Boosting的道理,也就是不错地重复学习达到最终的要求。Boosting的提出与发展离不原创 2021-07-26 21:31:47 · 84 阅读 · 0 评论 -
集成学习-Bagging与随机森林(DataWhale第二期)
1、bootstraps是一种将线性回归参数 B^,通过多次求解后再进行求方差得出的,过程称为自助采样。2、Bagging是由 Bootstraps 演化而来的3、Bagging的核心在于自助采样(bootstrap)这一概念,即有放回的从数据集中进行采样,也就是说,同样的一个样本可能被多次进行采样。一个自助采样的小例子是我们希望估计全国所有人口年龄的平均值,那么我们可以在全国所有人口中随机抽取不同的集合(这些集合可能存在交集),计算每个集合的平均值,然后将所有平均值的均值作为估计值。4、Bagg..原创 2021-07-22 22:54:31 · 128 阅读 · 1 评论 -
集成学习-逻辑回归原理/线性判别/决策树(DataWhale第二期)
1、逻辑回归逻辑推导import pandas as pdfrom sklearn import datasetsiris = datasets.load_iris()X = iris.datay = iris.targetfeature = iris.feature_namesdata = pd.DataFrame(X,columns=feature)data['target'] = ydata.head() sepal length (原创 2021-07-20 23:17:56 · 488 阅读 · 1 评论 -
集成学习-knn/极大似然估计/方差与偏差/岭回归和Lasso回归原理(DataWhale第二期)
import numpy as np引用B站:https://www.bilibili.com/video/BV1Uh411m74w?from=search&seid=4466513966431555719学自:【B站博主:萌弟AI】1、简单理解KNNx = np.array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])y = np.array([0,0,1,1])x,y(array([[1. , 1.1], [1. , 1. ],原创 2021-07-17 22:40:48 · 770 阅读 · 2 评论 -
集成学习-决策与回归基本原理推导(DataWhale第二期)
1.导论【转载自B站:萌弟AI数学基础基于Python】什么是机器学习?机器学习的一个重要的目标就是利用数学模型来理解数据,发现数据中的规律,用作数据的分析和预测。数据通常由一组向量组成,这组向量中的每个向量都是一个样本,我们用xix_ixi来表示一个样本,其中i=1,2,3,...,Ni=1,2,3,...,Ni=1,2,3,...,N,共N个样本,每个样本xi=(xi1,xi2,...,xip,yi)x_i=(x_{i1},x_{i2},...,x_{ip},y_i)xi=(xi1,xi2,原创 2021-07-16 00:47:29 · 241 阅读 · 0 评论 -
集成学习-高等线性代数-基于python(DataWhale第二期)
线性代数【转载自B站:萌弟AI数学基础基于Python】第一章:向量空间举例:正如我们所生活的三维空间,它就是一个向量空间。定义:令F是一个数域,对于一个集合V,对于任意的a,b∈F,α,β,γ∈V,我们称V为一个向量空间,则它必须满足以下条件:(1)α+β=β+α;(2)(α+β)+γ=α+(β+γ);(3)∃0∈V,它具有以下性质:∀α∈V,都有0+α=α;(4)对于V中的每一个向量α,在V中存在一个向量α′,使得α+α′=0。这样的α′叫做α的负向量;(5)a(α+β)=aα+aβ:原创 2021-07-14 00:35:29 · 139 阅读 · 0 评论 -
集成学习-高等数学基础-基于python(DataWhale第二期)
1.函数【转载自B站:萌弟AI数学基础基于Python】1.1 函数的定义定义:设数集 D⊂R, 则称映射 f:D→R 为定义在 D 上的函数,通常简记为 D \subset {\mathbf{R}}, \text { 则称映射 } f: D \rightarrow \mathbf{R} \text { 为定义在 } D \text { 上的函数,通常简记为 }D⊂R, 则称映射 f:D→R 为定义在原创 2021-07-13 22:43:37 · 468 阅读 · 0 评论