![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
集成学习
文章平均质量分 88
AnnoraJiao
这个作者很懒,什么都没留下…
展开
-
集成学习 Task08 案例学习
目录一、案例一 (幸福感预测)1. 问题描述2.数据3.建模二、案例二 (蒸汽量预测)1. 问题描述2.数据3.特征工程一、案例一 (幸福感预测)1. 问题描述比赛的数据使用的是官方的《中国综合社会调查(CGSS)》文件中的调查结果中的数据,其共包含有139个维度的特征,包括个体变量(性别、年龄、地域、职业、健康、婚姻与政治面貌等等)、家庭变量(父母、配偶、子女、家庭资本等等)、社会态度(公平、信用、公共服务)等特征。2.数据使用以上 139 维的特征,使用 8000 余组数据进行对于个人幸福感原创 2021-07-31 22:49:37 · 154 阅读 · 0 评论 -
集成学习 Task07 Stacking和案例一
目录一、Blending集成学习算法二、Stacking集成学习算法三、Blending与Stacking对比一、Blending集成学习算法下面我们来详细讨论下这个Blending集成学习方式:(1) 将数据划分为训练集和测试集(test_set),其中训练集需要再次划分为训练集(train_set)和验证集(val_set);(2) 创建第一层的多个模型,这些模型可以使同质的也可以是异质的;(3) 使用train_set训练步骤2中的多个模型,然后用训练好的模型预测val_set和test_原创 2021-07-28 22:31:21 · 131 阅读 · 0 评论 -
集成学习 Task06 Boosting
目录前言一、Boosting的基本思路二、使用步骤1.引入库2.读入数据总结前言提示:以下是本篇文章正文内容,下面案例可供参考一、Boosting的基本思路###“强可学习"和"弱可学习”示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下(示例):import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn原创 2021-07-24 22:31:02 · 152 阅读 · 1 评论 -
集成学习 Task05 Bagging
目录前言一、投票法的思路二、投票法的原理2.读入数据总结前言一、投票法的思路投票法是集成学习中常用的技巧,可以帮助我们提高模型的泛化能力,减少模型的错误率。一般情况下,错误总是发生在局部,因此融合多个数据是降低误差的一个好方法,这就是投票法的基本思路。对于回归模型来说,投票法最终的预测结果是多个其他回归模型预测结果的平均值。对于分类模型,硬投票法的预测结果是多个模型预测结果中出现次数最多的类别,软投票对各类预测结果的概率进行求和,最终选取概率之和最大的类标签。二、投票法的原理投票法是.原创 2021-07-22 21:27:24 · 130 阅读 · 0 评论 -
集成学习 Task04 机器学习基础(三)
目录二、使用sklearn构建完整的机器学习项目2.使用sklearn构建完整的分类项目(1) 收集数据集并选择合适的特征(2) 选择度量模型性能的指标(3) 选择具体的模型并进行训练(4) 评估模型的性能并调参三、总结二、使用sklearn构建完整的机器学习项目2.使用sklearn构建完整的分类项目回归和分类问题回归问题是连续的因变量,分类问题是离散变量。但都是从已知变量到未知变量的映射。分类问题可以在回归问题基础上增加归一化函数。(1) 收集数据集并选择合适的特征(2) 选择度..原创 2021-07-20 22:10:47 · 257 阅读 · 0 评论 -
集成学习 Task03 机器学习基础(二)
集成学习 Task03 机器学习基础(二)二、完整机器学习项目流程(续)4. 优化基础模型5. 对模型超参数进行调优(调参)二、完整机器学习项目流程(续)4. 优化基础模型我们在回归问题中使用训练集估计模型的参数的原则一般都是使得我们的损失函数在训练集达到最小值,其实在实际问题中我们是可以让损失函数在训练集最小化为0,如:在线性回归中,我加入非常多的高次项。但是:目的是让模型在未知且情况复杂的测试数据上表现优异。(a) 训练均方误差与测试均方误差过拟合的问题(b) 偏差-方差的权衡偏差和方原创 2021-07-17 22:27:03 · 91 阅读 · 0 评论 -
集成学习 Task02 回归问题
集成学习 Task02 回归问题一、机器学习导论二、使用sklearn构建完整的机器学习项目流程1. 收集数据集并选择合适的特征。2. 选择度量模型性能的指标。3. 选择具体的模型并进行训练以优化模型。4.评估模型的性能并调参。一、机器学习导论有监督学习无监督学习我们可以使用sklearn生成符合自身需求的数据集,下面我们用其中几个函数例子来生成无因变量的数据集:https://scikit-learn.org/stable/modules/classes.html?highlight=datas原创 2021-07-15 21:52:58 · 123 阅读 · 0 评论 -
集成学习 Task01 机器学习数学基础
集成学习 Task01 机器学习数学基础一、学习主题二、学习内容高等数学线性代数一、学习主题快速复习以下数学知识:高等数学和线性代数和概率论等知识;完成阶段一作业二、学习内容高等数学1.多元函数(1)n维空间: 【元素+对应关系】设 nnn 为取定的一个正整数,我们用 Rn\mathbf{R}^{n}Rn 表示 nnn 元有序实数组 (x1,x2,⋯ ,\left(x_{1}, x_{2}, \cdots,\right.(x1,x2,⋯,xn)\left.x_{n原创 2021-07-13 23:10:37 · 136 阅读 · 2 评论