lgt.Dataset构建模型数据详解

lgb中数据在使用前,需要经过Dataset处理。

import lightgbm as lgb

lgb_train = lgb.Dataset(X_train, y_train)
lgb_eval = lgb.Dataset(X_test, y_test, reference=lgb_train)

lgb.Dataset(data, label=None, reference=None, weight=None, group=None,
			 init_score=None, silent=False, feature_name='auto', 
			 categorical_feature='auto', params=None, free_raw_data=True)
  • reference:验证集。
  • weight:样本权重。
  • silent:是否静默。
  • feature_name:特征名称。若为’ auto '且data为DataFrame,直接使用数据列名称。
  • categorical_feature:指明类别列,lightGBM可以直接处理类别特征,不再需要将其转为one-hot形式。
  • max_bin:特征的最大离散箱数。
  • free_raw_data:如果为真,则在构造内部数据集之后释放原始数据,默认为真。若要再次利用数据,需设置为False。
  • 3
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值