2021SC@SDUSC软件工程应用与实践----项目综述

2021SC@SDUSC

一,项目介绍

选题

基于人工智能的多肽药物分析问题

项目背景

药物发现和研发是制药企业和化学科学家的重要研究领域。然而,低效率和高成本给该领域带来了障碍。此外,处理来自基因组学、蛋白质组学、微阵列和临床试验的大量复杂数据也存在挑战。人工智能和机器学习技术使制药领域实现了现代化,基于人工智能,多肽药物的药物开发,测试都能更加便捷。目前在多肽结构的预测,蛋白质结构预测,多肽与HLA的结合,DTA等方面都有广泛的应用。

本次项目中,我主要研究DTA (药物蛋白结合亲和力预测)

DTA背景

药物通过与靶蛋白相互作用来激活或抑制靶蛋白的生物学过程。 因此,识别新的药物靶标相互作用(DTIs)是药物发现领域的一个重要步骤,就像药物再利用。 然而,过渡的昂贵实验限制了识别新DTIs的过程。 因此,DTI预测的计算方法迫在眉睫。 近年来,大量研究提出了DTI预测的计算方法。 部分研究将DTI预测任务视为一个二值分类问题。 他们关注DTI的存在,而其他一些研究将其作为回归任务,直接预测结合亲和力评分。 在这里,结合亲和性得分描述了药物靶对相互作用的强度。 在本下项目中,我们主要研究药物靶标结合亲和力的预测  。

二,原码下载

原码在github上:GitHub - hkmztrk/DeepDTA

包括了项目用到的数据集和代码

已经配置好SSL密匙,直接git init初始化后,用git clone 就可以拷贝代码 

PS:因为之前就配置好了pytorch环境,在此就不赘述pytorch的安装,配置过程了

下载完成后用pytorch打开

data下为用到的两个数据集davis和diba

deepdta-toy 和 source下为项目运行代码

三,项目流程

1,输入:蛋白质序列+药物的SMILES(Simplified Molecular Input LineEntry System/简单的分子线性输入)

2,通过一个关系感知的自注意力块,通过SMILES对药物进行建模,该注意力块要在考虑所有元素关系的同时,强化化合物原子之间的相对位置信息

3,两个CNN模型分别学习药物和目标的表征

4,建立一个多头注意力块来模拟药物-标靶对的相似性作为交互信息,同时使用一个FNN(全联结网络)提取交互特征。

         截取自论文Deep drug-target binding affinity prediction withmultiple attention blocks

四,核心代码

主要对应试验操作的四个重要步骤

1,通过self-attention块,利用SMILES序列对药物进行建模

2,利用两个CNN(卷积神经网络)模型分别学习药物和靶蛋白的特征

3,建立multi-head-attention块用于模拟药物-标靶对的相似性

4,利用一个FNN(全联结网络)提取交互特征

五,项目分工

我主要负责:DTA中self-attention块的设置,处理,对SMILES序列建模和对蛋白质序列解析,以及训练CNN模型来得到药物和靶蛋白的特征,建立多头注意力块模拟结合的相似性,以及建立FNN来提取交互特征,并检验模型效果,和最终模型的反向传播优化。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

见到我请过去学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值