【ML】机器学习模型之PMML--概述

机器学习模型的应用一般会经历两个主要过程:

  • 1、离线开发
  • 2、线上部署

离线部分负责模型训练和导出模型,线上部分负责导入模型并且做预测。

在这里插入图片描述
以上图片来自:https://zhuanlan.zhihu.com/p/30378213

一、PMML简要介绍

PMML(Predictive Model Markup Language,PMML))是一套基于XML标准,与平台和环境无关的模型表示语言。它主要是通过了XML schema定义和储存了一个算法模型的核心元素:

  • 数据字典:描述输入数据
  • 数据转换:定义了原始数据数据预处理的方式,比如标准化、缺失值处理、哑变量的生成等
  • 模型定义:模型的类型及参数,比如树模型的分裂节点等
  • 模型输出:模型的输出结果

可以看出,通过定义PMML中的所有核心元素,可以完成数据挖掘的所有流程,即后端开发人员部署时,只需要将数据读取后,调用PMML文件,然后就能得到输出数据,而不用关注数据转化、模型参数等问题,加快了模型的部署效率。

二、PMML模型的生成和加载相关类库

PMML模型的生成相关的库需要看我们使用的离线训练库。如果我们使用的是sklearn,那么可以使用sklearn2pmml这个python库来做模型文件的生成;如果训练的模型是xgboost,也可以使用nyoka库中的xgboost_to_pmml导出pmml模型文件;

加载PMML模型需要目标环境支持PMML加载的库,如果是JAVA,则可以用JPMML来加载PMML模型文件;如果是python,使用pypmml来加载模型文件;

三、PMML总结与思考
  1. PMML为了满足跨平台,牺牲了很多平台独有的优化,所以很多时候我们用算法库自己的保存模型的API得到的模型文件,要比生成的PMML模型文件小很多。同时PMML文件加载速度也比算法库自己独有格式的模型文件加载慢很多。
  2. PMML加载得到的模型和算法库自己独有的模型相比,预测会有一点点的偏差,当然这个偏差并不大。比如某一个样本,用sklearn的决策树模型预测为类别1,但是如果我们把这个决策树落盘为一个PMML文件,并用JAVA加载后,继续预测刚才这个样本,有较小的概率出现预测的结果不为类别1.
  3. 对于超大模型,比如大规模的集成学习模型,比如xgboost, 随机森林,或者tensorflow,生成的PMML文件很容易得到几个G,甚至上T(根据实践经验,训练的数据集越大,pmml模型文件就越大),这时使用PMML文件加载预测速度会非常慢,此时推荐为模型建立一个专有的环境,就没有必要去考虑跨平台了。

参考:
https://cloud.tencent.com/developer/article/1596754
https://zhuanlan.zhihu.com/p/30378213
https://zhuanlan.zhihu.com/p/458117655

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 要下载pmml-lightgbm-example-executable-1.4-snapshot.jar,您可以按照以下步骤进行操作: 第一步,打开任意一个浏览器,例如Google Chrome,Mozilla Firefox或者Microsoft Edge。 第二步,使用浏览器搜索引擎,输入“pmml-lightgbm-example-executable-1.4-snapshot.jar 下载”进行搜索。 第三步,浏览搜索结果,并找到可信赖的下载源。可以尝试查找官方网站或相关开发者社区。 第四步,进入下载源的网站,找到相关的下载链接或按钮。 第五步,点击下载链接或按钮,开始下载pmml-lightgbm-example-executable-1.4-snapshot.jar。 第六步,等待下载完成。下载速度取决于您的互联网连接速度以及文件的大小。 第七步,下载完成后,在您的计算机上找到并保存该文件。可以选择在默认下载文件夹中保存,或者选择自定义的文件夹。 通过以上步骤,您可以成功下载pmml-lightgbm-example-executable-1.4-snapshot.jar。请注意确保您从可信赖的源获取文件,以防止下载到恶意软件或病毒。 ### 回答2: 要下载pmml-lightgbm-example-executable-1.4-snapshot.jar,你可以按照以下步骤进行操作: 1. 打开你的浏览器,并搜索"pmml-lightgbm-example-executable-1.4-snapshot.jar"。 2. 在搜索结果中找到可靠的下载来源,如GitHub、SourceForge等。 3. 点击下载链接,通常会有一个下载按钮或链接,点击它。 4. 你的浏览器会开始下载这个文件。你可以选择保存文件的位置或使用默认下载位置。 5. 下载完成后,在你选择的下载位置找到.jar文件。你可以使用文件管理器来导航到该位置。 6. 双击这个.jar文件,它将在你的计算机上自动运行/安装。 7. 如果有任何提示或说明,请按照该文件的指示进行。 这样,你就成功下载了pmml-lightgbm-example-executable-1.4-snapshot.jar文件。请注意,根据你下载文件的来源,步骤可能会有所不同。务必使用可靠且合法的来源来下载文件,以确保文件的安全性和完整性。 ### 回答3: 要下载pmml-lightgbm-example-executable-1.4-snapshot.jar,可以按以下步骤进行操作: 1. 打开网页浏览器,前往pmml-lightgbm-example在GitHub的页面。 2. 在页面上找到并点击“Download”按钮,通常位于页面的右上方。 3. 选择合适的下载选项,例如选择下载最新版本的jar文件。 4. 保存jar文件到你想要存放的目录中,可以选择默认的下载目录或者选择特定的文件夹。 5. 下载完成后,找到保存的jar文件。 现在,你已经成功地下载了pmml-lightgbm-example-executable-1.4-snapshot.jar文件,并可以在你的计算机中使用它了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

机器不学习我学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值