首届中国心电智能大赛初赛实现代码pytorch

最新推荐文章于 2023-08-17 15:20:51 发布

An_37

最新推荐文章于 2023-08-17 15:20:51 发布

阅读量983

点赞数 3

文章标签： pytorch python 深度学习

本文链接：https://blog.csdn.net/weixin_43932784/article/details/125474168

版权

本文介绍了一个使用PyTorch的竞赛任务，目标是通过常规静息心电图数据预测正常和异常心电图。作者提供了数据加载、预处理、模型构建（采用卷积神经网络）、训练及测试的详细步骤，展示了如何将标签转换、数据归一化，并使用交叉熵损失训练模型以检测心脏健康状况。

摘要由CSDN通过智能技术生成

1. 题目

目标是利用常规静息心电图的电压信号，预测“正常心电图”和“异常心电图”。根据心血管医生对心电图的诊断结果作为金标准，我们将那些没有明显异常的心电图作为“正常心电图”，并将包含一种或更多异常或疾病的心电图作为“异常心电图”。各团队需要在初赛规定时间内，利用训练集中常规心电图的电压信号，设计并实现可预测正常和异常等两类心电图的算法。

2. 数据

完整的训练集和测试集，共1000例常规心电图，其中训练集中包含600例，测试集中共400例。该数据是从多个公开数据集中获取。参赛团队需要利用有正常/异常两类标签的训练集数据设计和实现算法，并在没有标签的测试集上做出预测。

该心电数据的采样率为500 Hz。为了方便参赛团队用不同编程语言都能读取数据，所有心电数据的存储格式为MAT格式。该文件中存储了12个导联的电压信号。训练数据对应的标签存储在txt文件中，其中0代表正常，1代表异常。

3. 分析

数据集共有1000个样本，其中训练集包括600例，测试机400例。训练集是具有label的，用于训练模型；测试集没有label，需要我们用训练好的模型进行预测。
其实就是一个二分类问题
流程包括：数据加载与预处理，模型搭建，模型训练，模型测试

4. pytorch实现

（1）数据加载与处理（dataset.py）

from scipy.io import loadmat
import os
from torch.utils import data
import pandas as pd
import numpy as np


# 将标签转为OneHot（便于计算损失）
def convert2oneHot(index, Lens):
    hot = np.zeros((Lens,))
    hot[index] = 1
    return hot


#对数据进行归一化
def normalize(v):
    part1 = v - v.mean(axis=1).reshape((v.shape[0], 1))
    part2 = v.max(axis=1).reshape((v.shape[0], 1)) + 2e-12
    return part1 / part2


# 自定义数据加载函数
class MyDataset(data.Dataset):
    def __init__(self, mode, data_path):
        super(MyDataset, self).__init__()

        self.csv_path = os.path.join(data_path, "reference.csv")
        self.data_path = os.path.join(data_path, "TRAIN")
        self.temp_list = []  # mat文件名列表
        self._parse_dataset()

        self.mode = mode.lower()
        if self.mode == 'train':
            self.temp_list = self.temp_list[:500]
        elif self.mode == 'valid':
            self.temp_list = self.temp_list[500:]
        else:
            raise ValueError('mode must be "train" or "valid"!')

    def __getitem__(self, item):
        feature = self.get_feature(self.temp_list[item, 0])
        label = convert2oneHot(self.temp_list[item, 1], 2)
        return feature, label

    def __len__(self):
        return len(self.temp_list)

    def get_feature(self, name):
        mat = loadmat(os.path.join(self.data_path, name))
        dat = mat['data']
        feature = dat[0:12]  # feature: (12, 5000)
        # return normalize(feature).transpose()  # feature: (5000, 12)
        return normalize(feature)
	
	# 读入csv并转成np.array
    def _parse_dataset(self):
        self.temp_list = np.array(pd.read_csv(self.csv_path))

（2）网络模型搭建（model.py）

from torch import nn
# input: (20, 12, 5000)

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()

        self.layer1 = nn