基于Pytorch的卷积神经网络CNN实例应用及详解

本文详细介绍了基于Pytorch的卷积神经网络CNN,包括定义、原理和实现步骤。通过实例分析了CNN在药物靶体交互二分类问题上的应用,并提供了完整的代码实现,帮助读者深入理解CNN的运作机制。
摘要由CSDN通过智能技术生成

基于Pytorch的卷积神经网络CNN实例应用及详解

一、卷积神经网络CNN定义

卷积神经网络(CNN,有时被称为 ConvNet)是很吸引人的。在短时间内,它们变成了一种颠覆性的技术,打破了从文本、视频到语音等多个领域所有最先进的算法,远远超出了其最初在图像处理的应用范围。CNN 由许多神经网络层组成。卷积和池化这两种不同类型的层通常是交替的。网络中每个滤波器的深度从左到右增加。最后通常由一个或多个全连接的层组成。
在这里插入图片描述

二、卷积神经网络CNN的原理

三、卷积神经网络CNN实现的前期准备

四、卷积神经网络CNN实现案例分析

  • 案例目的:是构造卷积神经网络模型训练后进行药物靶体交互的二分类(0和1)预测。

  • 数据集及格式说明:首先案例用到的所有数据集是来自KIBA 数据集,数据以txt文本数据存储。

  • 亲和矩阵数据集Y说明:亲和矩阵的维度是[229,2110],分别表示229种蛋白质和2110种药物分子,矩阵对应的数值表示对应蛋白质和药物分子交互的亲和性,若为“nan”表示无亲和性也就是后续分类为0,其余为1。
    在这里插入图片描述

  • 药物及其smiles序列数据集ligands_iso说明:药物名称序号和对应的结构smiles序列,以字典形式保存,长度是2111(表示有2111种药物)。
    在这里插入图片描述

  • 蛋白质及其sequences序列数据集proteins说明:蛋白质名称序号和对应的结构sequences序列,以字典形式保存,长度为229(表示有229种蛋白质)。
    在这里插入图片描述

  • 训练集train_fold_setting说明:数据维度是[5,19709],也就是分为五组,每组包含19709个数字,其中数字N表示为亲和矩阵数据集Y所有行列组合数目是483190(229*2110)种组合中按顺序排的第N组。
    在这里插入图片描述

  • 测试集test_fold_setting说明:数据维度是[19709],也就是只有一组,该组包含19709个数字,其中数字N表示为亲和矩阵数据集Y所有行列组合数目是483190(229*2110)种组合中按顺序排的第N组。
    在这里插入图片描述

  • DTI案例CNN模型搭建大致如下(具体实现细节可见后面的代码)
    在这里插入图片描述

  • Label encoding 说明:将药物分子和蛋白质的序列的各种字符用数字字符替换,便于后面的词嵌入操作。

  • Embedding layer 说明:将药物分子和蛋白质的数字序列进行词嵌入操作,也就是增加一维度表示,比如原来的维度是一维只有长度(药物分子初始设置为100,蛋白质初始设置为1000),增加宽度(宽度初始设置都为128)这一维度。注意:卷积后长度宽度初始设置会变化

  • concatenation(串联)说明:将原本分开的每组药物分子特征和蛋白质序列特征拼接起来,也就是根据宽度相同将两者的长拼接起来,所以拼接的宽度不变,长度两者相加。

五、卷积神经网络CNN实现完整代码和结果

import torch as t
import pickle
import numpy as np
import json
import math
from torch import nn
import torch.nn.functional as F
from  sklearn.metrics import accuracy_score

# 构建训练集和测试集数据转换函数,对蛋白质和药物分子数据进行数据转换
def datatransform(data):
    drug = []  # 训练集和测试集对应的各下标的药物(配体)
    protein = []  # 训练集和测试集对应的各下标的蛋白质(靶体)
    for i in range(len(data)):
        drug.append(math.floor(data[i] / 229))
        protein.append((data[i] % 229))

    # 读取亲和矩阵Y数据
    # 亲和矩阵Y的维度是[229,2110],229表示蛋白质的种类数量,2110表示药物分子的种类数量,矩阵元素的值表示蛋白质与药物分子结合的亲和性,nan值表示不亲和也就是互相无作用
    Y = pickle.load(open("E:/data/kiba/Y", "rb"), encoding='latin1')
    effective = []  # 训练集和测试集对应的各下标的药物和蛋白质结合的有效性(亲和性)
    for i in range(len(data)):
        d = drug[i]
        p = protein[i]
        if np.isnan(Y[d][p]): # 判断受体靶体有无亲和性
            effective.append(0) # 受体靶体无亲和性
        else:
            effective.append(1) # 受体靶体有亲和性
    # list转为tensor
    effectives = t.LongTensor(effective) # 为损失函数计算做准备

    # 读取药物和其smiles序列
    drugs = json.load(open("E:\data\kiba\ligands_iso.txt"))
    drug_smiles = []  # 提取药物的smiles序列
    train_drug_smiles = []  # 进一步提取训练集和测试集药物的smiles序列
    for d in drugs.values():
        drug_smiles.append(d) # 只提取药物对应的smiles
    for td in range(len(drug)): # 每批次的药物数量
        train_drug_smiles.append(drug_smiles[drug[td]]) # 每批次要获取的药物数量对应的smiles序列

    # 读取蛋白质和其sequences序列
    proteins = json.load(
  • 4
    点赞
  • 66
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
在PyCharm中设计卷积神经网络中的池化层,需要先创建一个卷积神经网络模型,并在其中添加池化层。下面是一个简单的示例代码,展示了如何在PyCharm中创建一个包含池化层的卷积神经网络模型: ```python import tensorflow as tf # 创建卷积神经网络模型 model = tf.keras.models.Sequential([ # 添加卷积层 tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)), # 添加池化层 tf.keras.layers.MaxPooling2D((2, 2)), # 添加卷积层 tf.keras.layers.Conv2D(64, (3, 3), activation='relu'), # 添加池化层 tf.keras.layers.MaxPooling2D((2, 2)), # 添加卷积层 tf.keras.layers.Conv2D(64, (3, 3), activation='relu'), # 将卷积层的输出展平为一维向量 tf.keras.layers.Flatten(), # 添加全连接层 tf.keras.layers.Dense(64, activation='relu'), # 添加输出层 tf.keras.layers.Dense(10, activation='softmax') ]) # 输出模型的结构信息 model.summary() ``` 在上面的代码中,我们使用了`tf.keras`模块来创建一个卷积神经网络模型。首先使用`tf.keras.models.Sequential`函数创建一个空的模型,然后依次添加卷积层、池化层、卷积层、池化层、卷积层、展平层、全连接层和输出层。其中,池化层使用了`tf.keras.layers.MaxPooling2D`函数,它接受一个池化窗口的大小`(2, 2)`,并将输入张量的每个`2 x 2`的子区域取最大值作为输出。在模型创建完成后,我们调用`model.summary()`函数输出模型的结构信息,以便查看模型的层次结构、输入输出张量的形状等信息。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

rothschildlhl

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值