python版本， lightgbm使用示例

最新推荐文章于 2024-06-06 10:47:58 发布

samoyan

最新推荐文章于 2024-06-06 10:47:58 发布

阅读量1.9k

点赞数 2

分类专栏：机器学习文章标签：机器学习 python

本文链接：https://blog.csdn.net/baoyan2015/article/details/109571299

版权

机器学习专栏收录该内容

21 篇文章 1 订阅

订阅专栏

1、安装lightgbm包，

pip install lightgbm -i https://pypi.tuna.tsinghua.edu.cn/simple --default-timeout=100

2、lightgbm原理：

https://www.cnblogs.com/jiangxinyang/p/9337094.html

3、lightgbm使用示例：

def train(x_train, y_train, q_train, model_save_path):
    '''
    模型的训练和保存
    :param x_train:
    :param y_train:
    :param q_train:
    :param model_save_path:
    :return:
    '''

    train_data = lgb.Dataset(x_train, label=y_train, group=q_train)
    params = {
        'task': 'train',  # 执行的任务类型
        'boosting_type': 'gbrt',  # 基学习器
        'objective': 'lambdarank',  # 排序任务(目标函数)
        'metric': 'ndcg',  # 度量的指标(评估函数)
        'max_position': 10,  # @NDCG 位置优化
        'metric_freq': 1,  # 每隔多少次输出一次度量结果
        'train_metric': True,  # 训练时就输出度量结果
        'ndcg_at': [10],
        'max_bin': 255,  # 一个整数，表示最大的桶的数量。默认值为 255。lightgbm 会根据它来自动压缩内存。如max_bin=255 时，则lightgbm 将使用uint8 来表示特征的每一个值。
        'num_iterations': 200,  # 迭代次数，即生成的树的棵数
        'learning_rate': 0.01,  # 学习率
        'num_leaves': 31,  # 叶子数
        # 'max_depth':6,
        'tree_learner': 'serial',  # 用于并行学习，‘serial’： 单台机器的tree learner
        'min_data_in_leaf': 30,  # 一个叶子节点上包含的最少样本数量
        'verbose': 2  # 显示训练时的信息
    }
    gbm = lgb.train(params, train_data, valid_sets=[train_data])
    gbm.save_model(model_save_path)


def predict(x_test, comments, model_input_path):
    '''
     预测得分并排序
    :param x_test:
    :param comments:
    :param model_input_path:
    :return:
    '''

    gbm = lgb.Booster(model_file=model_input_path)  # 加载model

    ypred = gbm.predict(x_test)

    predicted_sorted_indexes = np.argsort(ypred)[::-1]  # 返回从大到小的索引

    t_results = comments[predicted_sorted_indexes]  # 返回对应的comments,从大到小的排序

    return t_results

def test_data_ndcg(model_path, test_path):
    '''
    评估测试数据的ndcg
    :param model_path:
    :param test_path:
    :return:
    '''

    with open(test_path, 'r', encoding='utf-8') as testfile:
        test_X, test_y, test_qids, comments = read_dataset(testfile)

    gbm = lgb.Booster(model_file=model_path)
    test_predict = gbm.predict(test_X)

    average_ndcg, _ = validate(test_qids, test_y, test_predict, 60)
    # 所有qid的平均ndcg
    print("all qid average ndcg: ", average_ndcg)
    print("job done!")

samoyan

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
1
评论
python版本， lightgbm使用示例

1、安装lightgbm包，pip install lightgbm -i https://pypi.tuna.tsinghua.edu.cn/simple --default-timeout=1002、lightgbm原理：https://www.cnblogs.com/jiangxinyang/p/9337094.html3、lightgbm使用示例：def train(x_train, y_train, q_train, model_save_path): '''.
复制链接

扫一扫