lgb train l1: 0 eval l1: 0 test l1: 0

最新推荐文章于 2023-11-21 12:07:45 发布

Changshu135

最新推荐文章于 2023-11-21 12:07:45 发布

阅读量380

点赞数

文章标签： python 开发语言

本文链接：https://blog.csdn.net/Changshu135/article/details/125747961

版权

lgb train l1: 0 eval l1: 0 test l1: 0

前言：笔者在训练lgb模型时，发现训练集，测试集，验证集的loss全是0。

在查模型查环境都没问题后，详细查了数据，才发现了问题，原来是在读取parquet数据时，有一个库没有装好，导致不能读取出来。但是这个库又不报错，显示的是灰色，并且这是别人的源代码，别人能跑也使我忽略了它，在这里记录一下。

1.snappy包是灰色

在使用python读取parquet文件，并转化为dataframe时，使用的代码是

tmp_data = ParquetFile(path_prefix + curr_date + '/' + file).to_pandas()

在这里需要引入的包有

from fastparquet import ParquetFile
import pandas as pd
import snappy

但是其中snappy包显示是灰色，会让人误认为这个包没有被使用，如果你忽略了安装这个包，那么你不能从parquet文件中读出数据
snappy

2.安装snappy

我的pycharm不能直接安装snappy，需要在自己的conda环境中安装，如下命令

conda activate your-env-name
conda install -c conda-forge snappy
pip install python-snappy

这样就能正确读出数据并训练，安装snappy

3.总结

1.如果训练时loss一直为0，可能出问题的地方有模型参数，运行环境，训练数据等。
2.在使用别人的代码时，不要轻易删除和注释代码。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Changshu135

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
lgb train l1: 0 eval l1: 0 test l1: 0

loss为0
复制链接

扫一扫

ML之lightgbm：LightGBM参数手册、调参技巧/调参顺序/网格搜索实现、lightgbm.train/LGBMClassifier/LGBMRegressor函数简介及其案例应用之详细攻略

近期请国内外头部出版社可尽快私信博主！——心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，谦虚，自律，反思，成长，还算是比较正能量的博主，公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然，有点小情怀，也有点使命感呀)…

10-24

3万+

ML之lightgbm：LightGBM参数手册、调参技巧/调参顺序/网格搜索实现、lightgbm.train/LGBMClassifier/LGBMRegressor函数简介及其案例应用之详细攻略目录 lightgbm库的调参技巧 LightGBM参数手册 lightgbm.train函数的参数解释 LGBMClassifier()函数的简介 LGBMRegressor()函数的简介 lightgbm库的调参技巧 1、经验技巧 (1)

【数据挖掘实战】——科大讯飞：跨境广告ROI预测(Baseline)

lingxw的博客

06-13

1815

跨境电商广告 ROI（收入/广告消耗）预测一直以来都是效果类广告领域的重要挑战。在当前全球化背景下，海外媒体流量成本不断攀升，加之广告主对广告投入产出的关注日益加强，使得对广告投放效果的预测成为当下迫切需要解决的问题。

1 条评论您还未登录，请先登录后发表或查看评论

python 实现lgb训练及模型预测

MusicDancing的博客

11-27

5358

使用训练好的lightgbm对测试集打分，并保留预测结果。 # coding:utf-8 import pandas as pd import lightgbm as lgb import sys THRESHOLD = 0.28 # 设定截断阈值 data_input_path = sys.argv[1] # 数据输入路径 data_output_path = sys.argv[2] # 数据输出路径 model_file_path = sys.argv[3] # 模型路径 # 1.加载测试数据.

lightGBM训练时报错：TypeError: train() got an unexpected keyword argument ‘verbose_eval‘

最新发布

happylele77的博客

11-21

6455

参数问题，都可以按这个思路解决

loss训练时的不下降、nan或者为0

shY Pa

07-16

5815

1、loss不下降： https://blog.csdn.net/qq_19329785/article/details/84260201 https://blog.csdn.net/zongza/article/details/89185852 https://blog.csdn.net/liuweiyuxiang/article/details/80856991 2、检测中faster...

蒸汽新人比赛代码，使用LGB（学习）

暮雨凉初透

11-17

1684

这是第一次写数据挖掘的学习笔记该类博客的初衷：经历实验室项目的初体验，做的是数据预处理、特征工程之类的事情。自己还是一个菜鸟，什么都不会也不太明白，做起来很盲目无从下手，最终的结果也是不理想。不得不自己想点办法，看到自己的不足需要学习很多数据挖掘和机器学习的知识。为了以后再做实验室项目不那么慌张，为了对得起学术型研究生这个称号，：中鸭！！赛题背景火力发电的基本原理...

数据处理（2.1）点击数据处理-lgb 训练实战

随意聊点

06-08

3988

这篇文章主要将上一篇文章中的 lgb 训练函数列出来，上一篇主要详细讲解预处理和后处理。 import lightgbm as lgb import numpy as np 1. 输入参数介绍输入参数主要有：训练集的特征列训练集的标签列验证集的特征列验证集的标签列 cate_cols 指明类别特征任务的类型 job=“classification” def base_train(x_train, y_train, x_test, y_test, cate_cols=..

python模型lgbm调优工具_机器学习应用之LGBM详解

weixin_29525745的博客

02-04

5891

内置方式建模要把数据读取成Dataset格式lgb.train去训练# coding: utf-8import jsonimport lightgbm as lgbimport pandas as pdfrom sklearn.metrics import mean_squared_error# 加载数据集合print('加载数据...')df_train = pd.read_csv('../da...

科大讯飞：电信客户流失预测挑战赛baseline

m0_64375823的博客

06-16

1610

参考：读取数据集：客户ID 地理区域是否双频是否翻新机当前手机价格手机网络功能婚姻状况家庭成人人数信息库匹配预计收入 ... 客户生命周期内平均月费用客户生命周期内的平均每月使用分钟数客户整个生命周期内的平均每月通话次数过去三个月的平均每月使用分钟数过去三个

LGB交叉验证KFOLD

weixin_42391768的博客

09-15

1336

lightgbm 调包侠自救指南

w55100的博客

05-15

4956

背景 lightGBM主要分为原生接口，与scikit-learn接口两种。除去传参与调包格式不一样，后者的save与load需要用sklearn来完成。 API手册：https://lightgbm.readthedocs.io/en/latest/Python-API.html 训练原生接口，使用lgb.train()方法。需要参数外挂为字典。 lgb_t...

lgb参数

qq_23069955的博客

06-12

2万+

参数： params = {'learning_rate': 0.2, # default=0.1, type=double, alias=shrinkage_rate 'application': 'binary', # default=regression，任务类型 'num_leaves': 31, #...

【机器学习基础】你应该知道的LightGBM各种操作！

fengdu78的博客

10-21

2536

LightGBM是基于XGBoost的一款可以快速并行的树模型框架，内部集成了多种集成学习思路，在代码实现上对XGBoost的节点划分进行了改进，内存占用更低训练速度更快。LightGB...

lgb多分类参数设置

qq_44643395的博客

09-05

1万+

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。本文链接：https://blog.csdn.net/weixin_41089007/article/details/90510248 数据 train_x, test_x, train_y, test_y = train_test_split(data, target, shuffle = ...

LightGBM算法总结

热门推荐

城市幽灵

08-21

9万+

1 LightGBM原理 1.1 GBDT和 LightGBM对比 GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型，其主要思想是利用弱分类器（决策树）迭代训练以得到最优模型，该模型具有训练效果好、不易过拟合等优点。GBDT 在工业界应用广泛，通常被用于点击率预测，搜索排序等任务。GBDT 也是各种数据挖掘竞赛的致命武器...

主流机器学习模型模板代码+经验分享[xgb, lgb, Keras, LR]

春华秋实

01-11

5822

刷比赛利器，感谢分享的人。摘要最近打各种比赛，在这里分享一些General Model，稍微改改就能用的环境： python 3.5.2 XGBoost调参大全： http://blog.csdn.net/han_xiaoyang/article/details/52665396 XGBoost 官方API： http://xgboost.read

提升算法——lightGBM原理学习笔记

机器学习、数据挖掘

10-31

3832

中文官方文档：http://lightgbm.apachecn.org/cn/latest/Installation-Guide.html 英文官方文档：https://lightgbm.readthedocs.io/en/latest/ 1.lightGBM安装在anaconda中输入：pip install lightGBM即可输入import lightgbm as lgb做测试...

lgb使用方法与调参

weixin_44414593的博客

07-19

5285

本文参考了lgb中文文档，和lgb调参笔记。 import lightgbm as lgb lgb参数 *type 1 不需要调试的参数 * boosting_type 1.gbdt 2.rf objective 1.regression 回归 2.binary 二分类（01） 3.multiclass 多分类（需要设置num_class） num_class 多分类的类别数 early_stopping_round 多少轮学习后无优化，则停止。 data 训练数据 valid验证数据 lgb_train

使用LightGBM完成训练及预测任务

sunyusunyu2011的专栏

08-12

1万+

LightGBM是微软开源的项目，最大的优点是：速度快！！！之前参加某个竞赛时是使用LightGBM完成的，效果还不错，也很简单，放出来供大家参考~ 官方文档：http://lightgbm.apachecn.org/cn/latest/index.html 本文采用的训练集，第一列是Y标签，之后每列是处理好的特征，具体选用哪些特征根据实际情况选择即可。 # -*- cod...

导入lgb时TypeError: load() missing 1 required positional argument: Loader

09-01

这个错误通常发生在使用`lgb.Booster.load()`方法时，缺少了一个必需的参数`Loader`。`Loader`参数指定模型文件的加载方式，默认为`model_from_file`。如果没有指定加载方式，就会出现该错误。为了解决这个问题，...