【神经网络-数据分类】利用深度学习神经网络（DNN）来对数据进行分类

最新推荐文章于 2024-07-25 13:37:16 发布

ZhuojunChen

最新推荐文章于 2024-07-25 13:37:16 发布

阅读量4.1k

点赞数 4

分类专栏：数据挖掘神经网络文章标签：神经网络数据挖掘

本文链接：https://blog.csdn.net/qq_39332551/article/details/117114185

版权

神经网络同时被 2 个专栏收录

8 篇文章 1 订阅

订阅专栏

数据挖掘

7 篇文章 0 订阅

订阅专栏

本文探讨了如何使用深度学习的CipvDNN模型处理大规模一维数据的分类任务，介绍了网络结构、优化器和损失函数的选择，并提供了训练和评估模型性能的步骤。通过Adam优化器和交叉熵损失，展示了如何通过实例代码实现和测试模型的预测效果。

摘要由CSDN通过智能技术生成

对于数据量大，适合以一维数据作为输入且难以探索数据内部规律的数据集，可以尝试利用深度学习神经网络（DNN）来对数据进行分类。

由于是分类问题，使用Adam作为优化器，交叉熵作为损失函数，大概的网络结构代码如下：

import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data.dataset import Dataset
from torch.utils.data import DataLoader

class CipvDNN(nn.Module):
    def __init__(self, input_dim,output_dim):
        super(CipvDNN, self).__init__()
        self.fc1 = nn.Linear(input_dim, 64)
        self.fc2 = nn.Linear(64, 32)
        self.fc3 = nn.Linear(32, output_dim)

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        #x = F.dropout(x, p=0.1)
        return x

    def predict(self, features):
        self.eval()
        features = torch.from_numpy(features).float()
        return self.forward(features).detach().numpy()

class CipvDataset(Dataset):
    def __init__(self, labels, features):
        super(CipvDataset, self).__init__()
        self.labels = labels
        self.features = features

    def __len__(self):
        return self.features.shape[0]

    def __getitem__(self, idx):
        feature = self.features[idx]
        label = self.labels[idx]
        return {'feature': feature, 'label': label}

class CipvTrain_DNN():
    def __init__(self):

        self.network = CipvDNN(100,20)
        self.learning_rate = 0.0001
        self.optimizer = torch.optim.Adam(self.network.parameters(), lr=self.learning_rate)
        self.criterion = nn.CrossEntropyLoss()
        self.num_epochs = 1000
        self.batchsize = 500
        #self.shuffle = True

    def train(self, features, labels):

        self.network.train()
        dataset = CipvDataset(labels, features)
        loader = DataLoader(dataset, batch_size=self.batchsize)
        #loader = DataLoader(dataset, shuffle=self.shuffle, batch_size = self.batchsize)

        for epoch in range(self.num_epochs):
            total_loss = 0.0
            for i, data in enumerate(loader):
                features = data['feature'].float()
                labels = data['label'].long()
                self.optimizer.zero_grad()
                predictions = self.network(features)
                loss = self.criterion(predictions, labels.squeeze(-1))
                loss.backward()
                total_loss += loss.item()
                self.optimizer.step()
            print('loss', total_loss / (i+1))

    def get_action(self, feature):
        self.network.eval()
        p = self.network.predict(feature)
        label = np.argmax(p)
        return label

在训练好之后，如何知道自己模型的预测效果呢？这里提供一个简单的预测函数。

def test_model(policy,features,labels):
    success_time=0
    for i in range(len(features)):
        label_got=policy.get_action(features[i])
        if label_got==labels[i]:
            success_time +=1
    success_rate = success_time/len(features)
    print('success rate',success_rate)
    return 0