第10步 LightGBM

Jet4505

已于 2023-06-12 09:29:55 修改

阅读量3k

点赞数 2

分类专栏：《100 Steps to Get ML》—JET学习笔记文章标签： python 深度学习 boosting

于 2023-02-16 17:37:07 首次发布

本文链接：https://blog.csdn.net/qq_30452897/article/details/129066104

版权

《100 Steps to Get ML》—JET学习笔记专栏收录该内容

103 篇文章 14 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

文章介绍了LightGBM作为XGBoost的优化版，其主要优点在于训练速度快和内存占用低。通过一个SUV购买预测的例子，展示了如何使用Python进行数据预处理、模型训练和预测。尽管模型评估结果显示LightGBM的随机参数设置并未超越逻辑回归，但强调了数据质量和模型调参的重要性。

摘要由CSDN通过智能技术生成

前言

上回说到Xgboost是数据竞赛大杀器，那它有没有缺点呢？答案是肯定的，简单来说就是训练速度慢、内存占用高。
所以呢，大佬就对其进行了改良，一方面呢，延续了 XGBoost 的那一套集成学习的方式；另一方面呢，相对于xgboost，具有训练速度快和内存占用率低的特点。它就是这一步要介绍的，LightGBM。
LightGBM的设计初衷就是提供一个快速高效、低内存占用、高准确度、支持并行和大规模数据处理的数据科学工具。
具体怎么改良的，就不细说了，有兴趣的可以自行百度食用。
我们直接上代码实战，继续SUV的例子：

一、导入库与数据

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.metrics import confusion_matrix
from sklearn.preprocessing import StandardS