【学习笔记】机器学习算法（三）基于LightGBM的分类预测

最新推荐文章于 2024-07-18 15:30:34 发布

HLLOVELZ

最新推荐文章于 2024-07-18 15:30:34 发布

阅读量4.7k

点赞数 5

文章标签： python 机器学习人工智能

本文链接：https://blog.csdn.net/HLLOVELZ/article/details/116200451

版权

本文介绍了LightGBM的基本概念、优点和缺点，并通过英雄联盟游戏数据集进行分类实践，包括数据预处理、模型训练、特征选择和参数调优，展示了LightGBM在实际问题中的应用。

摘要由CSDN通过智能技术生成

一、LightGBM简介

LightGBM的设计思路主要集中在减小数据对内存与计算性能的使用，以及减少多机器并行计算时的通讯代价。
LightGBM可以看作是XGBoost的升级豪华版，在获得与XGBoost近似精度的同时，又提供了更快的训练速度与更少的内存消耗。

LightGBM的主要优点：

LightGBM的主要缺点：

直接输入1次#，并按下space后，将生成1级标题。
输入2次#，并按下space后，将生成2级标题。
以此类推，我们支持6级标题。有助于使用TOC语法后生成一个完美的目录。

Step1: 库函数导入
Step2: 数据读取/载入
Step3: 数据信息简单查看
Step4: 可视化描述
Step5: 利用 LightGBM 进行训练与预测
Step6: 利用 LightGBM 进行特征选择
Step7: 通过调整参数获得更好的效果

这里的数据集直接从天池下载
在这里插入图片描述
数据集简介：
现在共有9881场英雄联盟韩服钻石段位以上的排位比赛数据，数据提供了在十分钟时的游戏状态，包括击杀数、死亡数、金币数量、经验值、等级……等信息。列blueWins是数据的标签，代表了本场比赛是否为蓝队获胜。

在这里插入图片描述
利用.head和.tail对数据进行查看

利用.describe()查看统计描述

对这些信息进行分析，不难发现

根据上面的描述，我们可以去除一些重复变量，比如只要知道蓝队是否拿到一血，我们就知道红队有没有拿到，可以去除红队的相关冗余数据。

## 根据上面的描述，我们可以去除一些重复变量，比如只要知道蓝队是否拿到一血，我们就知道红队有没有拿到，可以去除红队的相关冗余数据。
drop_cols = [&#

关注