JPMML-LightGBM 使用教程

JPMML-LightGBM 使用教程

jpmml-lightgbmJava library and command-line application for converting LightGBM models to PMML项目地址:https://gitcode.com/gh_mirrors/jp/jpmml-lightgbm

项目介绍

JPMML-LightGBM 是一个 Java 库和命令行应用程序,用于将 LightGBM 模型转换为 PMML(Predictive Model Markup Language)格式。该项目由 Openscoring Ltd 开发和维护,适用于需要在 Java/JVM 平台上部署 LightGBM 模型的场景。JPMML-LightGBM 遵循 AGPL-3.0 许可协议,但也可以通过签订许可协议,将其用于专有软件项目。

项目快速启动

环境要求

  • LightGBM 2.0.0 或更新版本
  • Java 1.8 或更新版本

安装步骤

  1. 克隆项目仓库:
    git clone https://github.com/jpmml/jpmml-lightgbm.git
    
  2. 进入项目根目录并使用 Apache Maven 构建项目:
    cd jpmml-lightgbm
    mvn clean install
    
  3. 构建完成后,会生成一个库 JAR 文件和一个可执行的 uber-JAR 文件:
    pmml-lightgbm/target/pmml-lightgbm-1.5-SNAPSHOT.jar
    pmml-lightgbm-example/target/pmml-lightgbm-example-executable-1.5-SNAPSHOT.jar
    

使用示例

  1. 使用 LightGBM 训练一个模型并保存到文本文件:
    library("lightgbm")
    df = read.csv("Audit.csv", stringsAsFactors = TRUE)
    X = df[c("Age", "Hours", "Income", "Education", "Employment", "Gender", "Marital", "Occupation")]
    y = df[["Adjusted"]]
    cat_cols = c("Education", "Employment", "Gender", "Marital", "Occupation")
    for(cat_col in cat_cols) {
        X[[cat_col]] = as.integer(X[[cat_col]]) - 1
    }
    dtrain = lgb.Dataset(as.matrix(X), label = y, categorical_feature = cat_cols)
    params = list("objective" = "binary", "num_iterations" = 131)
    audit_booster = lgb.train(params, dtrain)
    lgb.save.model(audit_booster, "LightGBMAudit.txt")
    
  2. 使用 JPMML-LightGBM 命令行转换器将文本文件转换为 PMML 文件:
    java -jar pmml-lightgbm-example/target/pmml-lightgbm-example-executable-1.5-SNAPSHOT.jar --lgbm-input LightGBMAudit.txt --pmml-output LightGBMAudit.pmml
    

应用案例和最佳实践

案例一:审计数据分类

使用 Audit.csv 数据集训练一个二分类模型,并将模型转换为 PMML 格式,以便在 Java/JVM 平台上部署。

最佳实践

  • 数据预处理:确保所有分类特征已正确编码为整数。
  • 模型参数调优:根据具体任务调整 LightGBM 的参数,以获得最佳性能。
  • 模型转换:使用 JPMML-LightGBM 将训练好的模型转换为 PMML 格式,确保模型在不同平台间的兼容性。

典型生态项目

JPMML-Evaluator

JPMML-Evaluator 是一个 Java 库,用于在 Java/JVM 平台上评估 PMML 模型。它与 JPMML-LightGBM 配合使用,可以实现从模型训练到部署的全流程。

Openscoring

Openscoring 是一个 REST web 服务,用于部署和管理 PMML 模型。通过 Openscoring,可以将 JPMML-LightGBM 转换的 PMML 模型部署为可远程调用的服务。

通过这些生态项目的配合,可以构建一个完整的机器学习模型开发和部署流程。

jpmml-lightgbmJava library and command-line application for converting LightGBM models to PMML项目地址:https://gitcode.com/gh_mirrors/jp/jpmml-lightgbm

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

余攀友

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值