![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
集成学习
文章平均质量分 95
一一张xi
这个作者很懒,什么都没留下…
展开
-
【集成学习】Blending和Stacking
目录1. Blending2. Stacking2.1 简单堆叠三层CV分类2.2 使用概率作为元特征2.3 堆叠5折CV分类与网格搜索(结合网格搜索调参优化)2.4 在不同特征子集上运行的分类器的堆叠2.5 ROC曲线Blending和Stacking对比Stacking,这个集成方法在比赛中被称为“懒人”算法,因为它不需要花费过多时间的调参就可以得到一个效果不错的算法。 stacking严格来说并不是一种算法,而是精美而又复杂的,对模型集成的一种策略。Stacking集成算法可以理解为一个两层的集成原创 2021-04-12 22:33:48 · 822 阅读 · 0 评论 -
【集成学习】task5 基本的分类模型
目录分类模型评价指标逻辑回归基于概率的分类模型:线性判别分析:基于贝叶斯公式对线性判别分析的理解降维分类的思想理解线性判别分析分类模型评价指标真阳性TP:预测值和真实值都为正例;真阴性TN:预测值与真实值都为正例;假阳性FP:预测值为正,实际值为负;假阴性FN:预测值为负,实际值为正;分类模型的指标:准确率:分类正确的样本数占总样本的比例,即:ACC=TP+TNFP+FN+TP+TNACC = \frac{TP+TN}{FP+FN+TP+TN}ACC=FP+FN+TP+TNTP+TN原创 2021-03-28 02:23:13 · 172 阅读 · 0 评论 -
【集成学习】task4 回归模型的评估及超参数调优
目录参数与超参数调参方法网格搜索 GridSearchCV():随机搜索RandomizedSearchCV()参数与超参数类似于参数w一样,使用最小二乘法或者梯度下降法等最优化算法优化出来的数我们称为参数;类似于 ???? 一样,我们无法使用最小二乘法或者梯度下降法等最优化算法优化出来的数我们称为超参数(1)参数模型参数是模型内部的配置变量,其值可以根据数据进行估计。行预测时需要参数。它参数定义了可使用的模型。参数是从数据估计或获悉的。参数通常不由编程者手动设置。参数通常被保存原创 2021-03-24 22:37:10 · 198 阅读 · 0 评论 -
【集成学习】task2 回归模型
回归模型回归模型回归模型评价指标线性回归模型【待补充】使用sklearn构建完整机器学习项目流程明确项目任务:回归/分类收集数据集并选择合适的特征。选择度量模型性能的指标。选择具体的模型并进行训练以优化模型。评估模型的性能并调参。回归模型回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(特征)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。通常使用曲线/线来拟合数据点,目标是使曲线到数据点的距离差异最小。本节依旧以波斯顿房价数据集为例#原创 2021-03-18 22:22:24 · 170 阅读 · 0 评论 -
【集成学习】task1 机器学习三大主要任务
目录什么是机器学习?机器学习任务有监督学习回归分类无监督学习什么是机器学习?机器学习的一个重要的目标就是利用数学模型来理解数据,发现数据中的规律,用作数据的分析和预测。数据通常由一组向量组成,这组向量中的每个向量都是一个样本,我们用xix_ixi来表示一个样本,其中i=1,2,3,...,Ni=1,2,3,...,Ni=1,2,3,...,N,共N个样本,每个样本xi=(xi1,xi2,...,xip,yi)x_i=(x_{i1},x_{i2},...,x_{ip},y_i)xi=(xi1,xi原创 2021-03-15 21:32:46 · 557 阅读 · 0 评论