集成学习
文章平均质量分 93
youself_jin
这个作者很懒,什么都没留下…
展开
-
五、集成学习——基本的分类模型
2.2 使用sklearn创建完整的分类项目2.2.1 收集数据集并选择合适的特征:IRIS鸢尾花数据集from sklearn import datasetsiris = datasets.load_iris()X = iris.datay = iris.targetfeature = iris.feature_namesdata = pd.DataFrame(X,columns=feature)data['target'] = ydata.head()各个特征的相关解释:se原创 2021-03-24 21:08:02 · 866 阅读 · 0 评论 -
四、集成学习——回归模型的评估及超参数调优
2.1.5 对模型超参数进行调优(调参)在刚刚的讨论中,我们似乎对模型的优化都是对模型算法本身的改进,比如:岭回归对线性回归的优化在于在线性回归的损失函数中加入L2正则化项从而牺牲无偏性降低方差。但是,大家是否想过这样的问题:在L2正则化中参数λ\lambdaλ应该选择多少?是0.01、0.1、还是1?到目前为止,我们只能凭经验或者瞎猜,能不能找到一种方法找到最优的参数λ\lambdaλ?事实上,找到最佳参数的问题本质上属于最优化的内容,因为从一个参数集合中找到最佳的值本身就是最优化的任务之一,我们脑海中原创 2021-03-24 19:13:10 · 238 阅读 · 0 评论 -
三、集成学习——偏差与方差理论
2.1.4 优化基础模型在基本的回归模型的回归问题的基本算法中,我们使用数据集去估计模型的参数,如线性回归模型中的参数w,那么这个数据集我们称为训练数据集,简称训练集。我们在回归问题中使用训练集估计模型的参数的原则一般都是使得我们的损失函数在训练集达到最小值,其实在实际问题中我们是可以让损失函数在训练集最小化为0,如:在线性回归中,我加入非常多的高次项,使得我们模型在训练集的每一个数据点都恰好位于曲线上,那这时候模型在训练集的损失值也就是误差为0。既然能做到这件事,是不是代表我们的建模完事大吉呢?换句原创 2021-03-19 11:10:02 · 296 阅读 · 0 评论 -
二、集成学习——基本的回归模型
2. 使用sklearn构建完整的机器学习项目流程一般来说,一个完整的机器学习项目分为以下步骤:明确项目任务:回归/分类收集数据集并选择合适的特征。选择度量模型性能的指标。选择具体的模型并进行训练以优化模型。评估模型的性能并调参。2.1 使用sklearn建立完整的回归项目2.1.1 收集数据集并选择合适的特征在数据集上我们使用我们比较熟悉的Boston房价数据集,原因是:第一个,我们通过这些简单的数据集快速让我们上手sklearn,以及掌握sklearn的相关操作。第二个,我们原创 2021-03-17 16:01:56 · 1795 阅读 · 0 评论 -
一、集成学习——机器学习的三大主要任务
1.导论什么是机器学习?机器学习的一个重要的目标就是利用数学模型来理解数据,发现数据中的规律,用作数据的分析和预测。数据通常由一组向量组成,这组向量中的每个向量都是一个样本,我们用 ???????? 来表示一个样本,其中 ????=1,2,3,…,???? ,共N个样本,每个样本 ????????=(????????1,????????2,…,????????????,????????) 共p+1个维度,前p个维度的每个维度我们称为一个特征,最后一个维度 ???????? 我们称为因变量(响应变量)。特征原创 2021-03-15 15:03:46 · 286 阅读 · 0 评论