![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Datawhale集成学习笔记
文章平均质量分 94
辰风123456
这个作者很懒,什么都没留下…
展开
-
TASK6-Boosting
作业1. Adaboost的基本思路?2. Adaboost与GBDT的联系与区别?3. Boosting与Bagging的区别,以及如何提升模型的精度?4. 使用基本分类模型和Boosting提升的模型,并画出他们的决策边界。5. 尝试使用XGboost模型完成一个具体的分类任务,并进行调参。...原创 2021-08-26 20:08:03 · 128 阅读 · 0 评论 -
TASK5-Bagging
作业1. 什么是bootstraps?2. bootstraps与baggingn的联系。3. 什么是bagging?4. 随机森林与bagging的联系与区别。5. 使用偏差与方差理论阐述为什么bagging能提升模型的预测精度?6. 请尝试使用bagging与基本分类模型或者回归模型做对比,观察bagging是否相对于基础模型的精度有所提高?7. 假如让你来实现bagging看,你会使用python+numpy+sklearn的基础模型来实现bagging吗?...原创 2021-08-25 11:28:21 · 275 阅读 · 0 评论 -
TASK04-分类问题
视频要点P20 分类问题的概述与解决方案回归预测连续值,分类预测离散值不同类别预测错误的代价不相同真阳性TP:预测值和真实值都为正例;真阴性TN:预测值与真实值都为正例;假阳性FP:预测值为正,实际值为负;假阴性FN:预测值为负,实际值为正;混淆矩阵(Confusion Matrix):混淆矩阵的每一列代表了预测类别,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。分类模型的指标:准确率:分类正确的样原创 2021-08-23 20:12:15 · 202 阅读 · 0 评论 -
TASK3-方差和偏差理论
视频要点P13 偏差和方差理论方差这里直接粘贴一个视频里的例子,很形象:我们想要建立一个线性回归模型,可以通过输入中国人身高去预测我们的体重。但是显然我们没有办法把全中国13亿人做一次人口普查,拿到13亿人的身高体重去建立模型。我们能做的就是从13亿中抽1000个样本进行建模,我们对这个抽样的过程重复100遍,就会得到100个1000人的样本集。我们使用线性回归模型估计参数就能得到100个线性回归模型。由于样本抽取具有随机性,我们得到的100个模型不可能参数完全一样,那么这100个模型之间的差异就原创 2021-08-20 17:51:18 · 250 阅读 · 0 评论 -
CH2-回归问题
视频学习要点P1 有监督学习和无监督学习有监督学习: 有因变量,有特征向量,目标是能够对未在数据集中出现的输入给出合理的预测,可分为:回归:目标变量连续分类:目标变量离散无监督学习: 无因变量,有特征向量,目标是寻找数据中的结构典型数据集:有监督学习数据集:回归:sklearn.datasets.load_boston分类:load_iris无监督学习数据集:月牙型非凸集:make_moons符合正太分布的聚类数据:make_blobsP2 回归问题解决原创 2021-08-18 21:55:23 · 229 阅读 · 0 评论