将Spark的ML/MLlib机器学习库中算法生成的模型存入数据库

最新推荐文章于 2024-05-05 21:00:14 发布

隔壁老王OldKing

最新推荐文章于 2024-05-05 21:00:14 发布

阅读量4k

点赞数 4

分类专栏：算法文章标签：算法机器学习 Spark 模型

本文链接：https://blog.csdn.net/JerryWangJY/article/details/84935544

版权

在使用Spark的ML/MLlib过程中，想要将算法生成的模型进行保存，方便下次调用，模型的save方法可以将模型以文件的形式保存到磁盘中，但是如果代码运行在其他环境中想要调用模型的话，需要将模型文件copy到其他环境中并配置好模型文件的路径，这样就很麻烦。所以将模型保存至数据库中，其他环境调用起来就很方便。

解决思路

写入：将模型转换为二进制流存入数据库
读取：将数据库中读取的数据进行反序列化，强制转换为对应的模型类型

具体实现

表：

CREATE TABLE `tb_sms_model` (
  `id` varchar(255) NOT NULL,
  `model` blob COMMENT '模型',
  `create_time` datetime DEFAULT NULL COMMENT '创建时间',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

模型对象（.java）：

public class SensitiveSMSModel implements Serializable {

    private String id;// 主键id

    private byte[] model; // 模型

    private String createTime;// 创建时间

    public String getId() {
        return id;
    }

    public void setId(String id) {
        this.id = id;

最低0.47元/天解锁文章

隔壁老王OldKing

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
3
评论
将Spark的ML/MLlib机器学习库中算法生成的模型存入数据库

在使用Spark的ML/MLlib过程中，想要将算法生成的模型进行保存，方便下次调用，模型的save方法可以将模型以文件的形式保存到磁盘中，但是如果代码运行在其他环境中想要调用模型的话，需要将模型文件copy到其他环境中并配置好模型文件的路径，这样就很麻烦。所以将模型保存至数据库中，其他环境调用起来就很方便。解决思路写入：将模型转换为二进制流存入数据库读取：将数据库中读取的数据进行反序列化，...
复制链接

扫一扫