Java Deeplearning4j：构建和训练卷积神经网络（CNN）模型

一只蜗牛儿

于 2024-10-09 08:34:00 发布

阅读量256

点赞数 7

文章标签： java cnn 开发语言

本文链接：https://blog.csdn.net/qq_42978535/article/details/142763604

版权

深度学习已经成为了现代人工智能领域的核心技术，而卷积神经网络（CNN）在图像处理、计算机视觉等任务中表现尤为突出。本文将通过使用 Java 的 Deeplearning4j 库，详细介绍如何构建和训练一个简单的卷积神经网络模型。我们将涵盖模型构建、数据预处理、训练以及评估的完整流程。

一、环境准备

在开始之前，请确保您的开发环境中已经安装了以下工具和库：

Java Development Kit (JDK) 1.8 或更高版本
Maven（构建管理工具）
Deeplearning4j 和 ND4J 库

Maven 依赖配置

在 pom.xml 中添加以下依赖：

<dependencies>
    <dependency>
        <groupId>org.deeplearning4j</groupId>
        <artifactId>deeplearning4j-core</artifactId>
        <version>1.0.0-M1</version>
    </dependency>
    <dependency>
        <groupId>org.nd4j</groupId>
        <artifactId>nd4j-native-platform</artifactId>
        <version>1.0.0-M1</version>
    </dependency>
    <dependency>
        <groupId>org.datavec</groupId>
        <artifactId>datavec-api</artifactId>
        <version>1.0.0-M1</version>
    </dependency>
</dependencies>

二、数据准备

在本示例中，我们将使用 MNIST 手写数字数据集。我们可以从 Deeplearning4j 提供的工具库中直接加载此数据集。

加载数据集

import org.datavec.api.split.FileSplit;
import org.datavec.api.split.InputSplit;
import org.datavec.api.records.reader.RecordReader;
import org.datavec.api.records.reader.impl.RecordReaderBase;
import org.datavec.api.split.TrainTestSplit;
import org.datavec.image.loader.ImageLoader;
import org.nd4j.linalg.dataset.api.iterator.DataSetIterator;
import org.nd4j.linalg.dataset.api.iterator.ListDataSetIterator;
import org.nd4j.linalg.dataset.api.iterator.MnistDataSetIterator;

public class DataPreparation {
    public static DataSetIterator loadMnistData() throws Exception {
        return new MnistDataSetIterator(28, 28, 10, true, true);
    }
}

三、构建卷积神经网络（CNN）模型

使用 Deeplearning4j 构建卷积神经网络模型。

CNN 模型构建

import org.deeplearning4j.nn.conf.MultiLayerConfiguration;
import org.deeplearning4j.nn.conf.NeuralNetConfiguration;
import org.deeplearning4j.nn.conf.layers.ConvolutionLayer;
import org.deeplearning4j.nn.conf.layers.DenseLayer;
import org.deeplearning4j.nn.conf.layers.OutputLayer;
import org.nd4j.linalg.activations.Activation;
import org.nd4j.linalg.learning.config.Adam;
import org.nd4j.linalg.lossfunctions.LossFunctions;

public class CNNModel {
    public static MultiLayerConfiguration buildModel() {
        return new NeuralNetConfiguration.Builder()
                .seed(12345) // 设置随机种子
                .updater(new Adam(0.001)) // 学习率
                .list()
                .layer(0, new ConvolutionLayer.Builder(5, 5) // 5x5 卷积核
                        .nIn(1) // 输入层通道数
                        .nOut(20) // 输出层通道数
                        .activation(Activation.RELU) // 激活函数
                        .build())
                .layer(1, new DenseLayer.Builder()
                        .nOut(100)
                        .activation(Activation.RELU)
                        .build())
                .layer(2, new OutputLayer.Builder(LossFunctions.LossFunction.NEGATIVELOGLIKELIHOOD)
                        .activation(Activation.SOFTMAX)
                        .nOut(10) // 类别数量
                        .build())
                .setInputType(InputType.convolutional(28, 28, 1)) // 输入数据形状
                .build();
    }
}

四、训练模型

训练模型的过程通常包括多次迭代，直到模型的性能达到预期。

训练过程实现

import org.deeplearning4j.nn.multilayer.MultiLayerNetwork;
import org.nd4j.linalg.dataset.api.iterator.DataSetIterator;
import org.nd4j.linalg.dataset.api.iterator.MnistDataSetIterator;
import org.nd4j.linalg.learning.config.Adam;

public class TrainModel {
    public static void main(String[] args) throws Exception {
        // 加载 MNIST 数据集
        DataSetIterator mnistTrain = new MnistDataSetIterator(64, true, 12345);
        DataSetIterator mnistTest = new MnistDataSetIterator(64, false, 12345);

        // 构建 CNN 模型
        MultiLayerNetwork model = new MultiLayerNetwork(CNNModel.buildModel());
        model.init();

        // 训练模型
        for (int i = 0; i < 10; i++) { // 训练10个epoch
            model.fit(mnistTrain);
            System.out.println("Epoch " + (i + 1) + " complete.");
        }
    }
}

五、评估模型

在训练完成后，需要评估模型的性能，以判断其在测试集上的表现。

模型评估实现

import org.deeplearning4j.eval.Evaluation;
import org.nd4j.linalg.dataset.api.iterator.DataSetIterator;

public class EvaluateModel {
    public static void main(String[] args) throws Exception {
        // 加载 MNIST 测试集
        DataSetIterator mnistTest = new MnistDataSetIterator(64, false, 12345);

        // 评估模型
        Evaluation eval = new Evaluation(10); // 10个类别
        while (mnistTest.hasNext()) {
            var ds = mnistTest.next();
            var output = model.output(ds.getFeatures());
            eval.eval(ds.getLabels(), output);
        }
        System.out.println(eval.stats());
    }
}