《天池龙珠 - 机器学习训练营》02.机器学习算法: 基于XGBoost的分类预测 学习笔记

本文探讨了XGBoost的优缺点,重点在于其在处理大规模数据时的高效性与深度学习在海量数据下的优势对比,以及如何在实际场景中权衡。学习者疑惑在大量数据下为何不直接使用深度学习,本文将提供见解并总结XGBoost原理与参数理解。
摘要由CSDN通过智能技术生成

本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/promotion/aicampml

一、学习知识点概要

简单介绍一下XGBoost,并对比XGBoost的优缺点和历史发展及应用。
借助天气数据集进行XGBoost模型的训练测试预测的分类实战。
最后介绍XGBoost模型的重要参数含义和XGBoost模型的原理。

二、学习内容

了解到了XGBoost的历史背景及使用XGBoost的应用成果。
复习了XGBoost的优缺点,对XGBoost认识更加清晰。
复习了数据可视化的操作。
了解了seaborn绘图函数库的简单使用。
复习了XGBoost的训练与预测。
学习了利用 XGBoost 进行特征选择。
复习了XGBoost的一些重要参数。
学习了XGBoost的一些基本原理。

三、学习问题与解答

【问题描述】
这是我自己剔除的一个疑问,个人觉得有点矛盾,**希望有大佬在学习过程中,能帮助我解答一下。**大致描述如下:
摘抄天池实验室的教学文本中的两句话:

XGBoost的主要优点:
2. 高效可扩展。在处理大规模数据集时速度快效果好,对内存等硬件资源要求不高。

XGBoost的主要缺点:
2.在拥有海量训练数据,并能找到合适的深度学习模型时,深度学习的精度可以遥遥领先XGBoost。

优点中说了处理大规模数据的速度比较好。缺点中说的是大量数据下,深度学习比XGBoost有优势。
那么,既然大量数据下深度学习优势更大,为什么不用深度学习框架呢,XGBoost的处理速度再快,正确率不高,也不能起到很好的作用啊。

四、学习思考与总结

通过本节的学习,让我回顾了集成学习中XGBoost的使用,并且了解了一些XGBoost的简单原理。
同时学习了一个从未接触过的函数库 —— seaborn绘图函数库。
并且对XGBoost有了一些自己的思考。

希望大佬们能够对上面提出的问题进行指点

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值