【lightgbm 使用经验总结教训】

 

做快手公司举办的2018中国高校计算机大赛--大数据挑战赛有半个月了,从5月30日开始到现在基本一直在构造特征,但是当我构造的特征到后期的时候,发现加特征之后,明明验证集上的准确率提高了,但是线上的结果一直提不上去,我怀疑的是特征的问题,但是今天6月13日,我仔细看了lightgbm算法的说明文档后才发现,我用的earlystopping方法一直没有用迭代最好的那一次去预测,即这个
同时,有一个新发现,lightgbm可以自动处理类别特征

 

 

同时,还有自动缺失值的处理

 

 

开了一个技术交流的公众号,里面记录一些在学习有关深度学习,推荐系统与机器学习过程中的笔记与心得,欢迎关注~

                                                                   

LightGBM是一个基于梯度提升决策树(Gradient Boosting Decision Tree)的机器学习框架,它在处理大规模数据集时具有高效性能。下面是Python中使用LightGBM的基本步骤: 1. 安装LightGBM库:使用pip命令安装LightGBM库,例如:`pip install lightgbm` 2. 导入必要的库:在Python脚本中导入LightGBM库和其他需要的库,例如: ```python import lightgbm as lgb from sklearn.model_selection import train_test_split ``` 3. 准备数据集:将数据集划分为训练集和测试集,并将其转换为LightGBM所需的数据格式。通常,LightGBM可以直接处理原始数据,无需进行特征缩放或独热编码。 4. 创建LightGBM数据集:使用`lgb.Dataset()`函数创建LightGBM所需的数据集对象,例如: ```python train_data = lgb.Dataset(X_train, label=y_train) test_data = lgb.Dataset(X_test, label=y_test) ``` 5. 设置模型参数:定义LightGBM模型的参数,例如学习率、树的数量、最大深度等。可以使用`lgb.train()`函数的`params`参数来设置这些参数。 6. 训练模型:使用`lgb.train()`函数训练LightGBM模型,例如: ```python model = lgb.train(params, train_data, num_boost_round=100) ``` 7. 模型预测:使用训练好的模型进行预测,例如: ```python y_pred = model.predict(X_test) ``` 8. 模型评估:根据任务类型选择适当的评估指标,例如分类任务可以使用准确率、召回率等指标进行评估。 9. 调参优化:根据模型表现进行参数调整和优化,以提高模型性能。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值