4模型导出_机器学习模型部署—PMML

最新推荐文章于 2025-05-09 18:24:41 发布

山语经

最新推荐文章于 2025-05-09 18:24:41 发布

阅读量1.5k

点赞数 1

文章标签： 4模型导出

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35926197/article/details/112581271

版权

本文介绍了如何将Python中训练的GBDT和随机森林模型导出为PMML文件，以便在Java环境中直接使用。PMML是一种预测模型标记语言，用于描述机器学习模型。文章详细展示了从数据导入、模型训练到模型导出的步骤，并讨论了PMML的优缺点，包括平台无关性和广泛支持性，但也指出其在数据预处理和深度学习模型支持上的局限性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

之前阐述了逻辑回归、孤立森林等建模方法，本文介绍如何把建好的模型保存为标准格式(PMML文件)。那么，什么情况下需要把模型保存为 PMML 文件？当模型需要 跨平台部署 或 反复调用 时，可以把模型保存为PMML文件。比如最近要上线一个反欺诈模型(用的GBDT)。训练模型用的Python(里面有很多现成的库，构建机器学习模型较方便)，生产调用用的Java(写机器学习模型非常麻烦)。

这时需要在Python中把训练好的模型保存为PMML文件，到Java中直接调用预测。

本文目录

什么是PMML？

Python中把模型保存为PMML的标准格式

实例一：把GBDT模型保存为PMML文件
3.1 导入数据
3.2 取出建模所需的变量
3.3 训练模型并保存为PMML文件

实例二：把随机森林模型保存为PMML文件
4.1 导入包
4.2 按标准流程建模并导出PMML文件

PMML的优缺点
5.1 优点
5.2 缺点

一、什么是PMML

PMML(Predictive Model Markup Language)：预测模型标记语言，它用XML格式来描述生成的机器学习模型，是目前表示机器学习模型的实际标准。

若要将在Python中训练好的模型部署到生产上时，可以使用目标环境解析PMML文件的库来加载模型，并做预测。

二、Python中模型保存为PMML的标准格式

Python中把模型导出为PMML文件的一般流程如下：

step1：特征处理(DataFrameMapper函数)。
step2：训练模型(pipeline函数)。
step3：导出模型(sklearn2pmml函数)。

其中step1不是必须步骤。

接下来看两个具体实例。

三、实例一：把GBDT模型保存为PMML文件

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。