使用Weka进行数据挖掘（Weka教程九）模型序列化/持久化存储和加载

最新推荐文章于 2021-03-03 20:57:25 发布

yang1young

最新推荐文章于 2021-03-03 20:57:25 发布

阅读量3.3k

点赞数 1

分类专栏： Weka+Java数据挖掘文章标签： java weka 序列化反序列化

本文链接：https://blog.csdn.net/qiao1245/article/details/50896362

版权

Weka+Java数据挖掘专栏收录该内容

9 篇文章 22 订阅

订阅专栏

有很多时候，你在构建了一个模型并完成调优后，你很可能会想把这个模型存入到磁盘中，免得下次再重新训练。尤其是神经网络、SVM等模型训练时间非常长，重新训练非常浪费时间。那么怎么持久化模型呢？
其实既然模型也是一个JAVA对象，那我就按照JAVA的序列化和反序列化方法保存模型对象即可。

Java中的序列化和反序列化

①java.io.ObjectOutputStream
代表对象输出流，它的writeObject(Object obj)方法可对参数指定的obj对象进行序列化，把得到的字节序列写到一个目标输出流中。
　　
②java.io.ObjectInputStream
代表对象输入流，它的readObject()方法从一个源输入流中读取字节序列，再把它们反序列化为一个对象，并将其返回。
需要注意的是，只有实现了Serializable和Externalizable接口的类的对象才能被序列化。Externalizable接口继承自 Serializable接口，实现Externalizable接口的类完全由自身来控制序列化的行为，而仅实现Serializable接口的类可采用默认的序列化方式。

对象序列化包括如下步骤：
1）创建一个对象输出流，它可以包装一个其他类型的目标输出流，如文件输出流；
2）通过对象输出流的writeObject()方法写对象

对象反序列化的步骤如下：
1）创建一个对象输入流，它可以包装一个其他类型的源输入流，如文件输入流；
2）通过对象输入流的readObject()方法读取对象。

实现Weka模型的序列化

直接贴出代码，以J48为例

public static void persistModel(J48 model, String ModelPath) {
        ObjectOutputStream oos = null;
        try {
            oos = new ObjectOutputStream(
            new FileOutputStream(ModelPath));
            oos.writeObject(model);
            oos.flush();
            oos.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

Weka模型的重新加载

重新加载模型只需要进行反序列化即可：

public static J48 reloadPersistModel(String ModelPath) {
        ObjectInputStream ois = null;
        try {
            ois = new ObjectInputStream(
            new FileInputStream(new File(ModelPath)));
            J48 model = (J48) ois.readObject();
            return model;
        } catch (Exception e) {
            e.printStackTrace();
        }
        return null;
    }

需要注意的是，要将序列化后的对象向下转型才可以获取子类特有方法。

yang1young

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
使用Weka进行数据挖掘（Weka教程九）模型序列化/持久化存储和加载

有很多时候，你在构建了一个模型并完成调优后，你很可能会想把这个模型存入到磁盘中，免得下次再重新训练。尤其是神经网络、SVM等模型训练时间非常长，重新训练非常浪费时间。那么怎么持久化模型呢？其实既然模型也是一个JAVA对象，那我就按照JAVA的序列化和反序列化方法保存模型对象即可。Java中的序列化和反序列化①java.io.ObjectOutputStream 代表对象输出流，它的writ
复制链接

扫一扫