山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题

2021SC@SDUSC

基于人工智能的多肽药物分析问题——第一周学习记录

主题:肽与HLA分子结合预测研究
生物学背景与机理:

细胞蛋白抗原在水解后,会产生许多短肽,这些短肽与HLA-I分子结合后会形成复合体,复合体在提呈之后,会被CDT+8细胞识别,并产生免疫反应。因此,通过预测肽与HLA-I分子的结合,能够实现抗原表位的追踪,并进一步用于癌症治疗和疫苗开发。

学习论文:

《DeepHLApan: A Deep Learning Approach for Neoantigen Prediction Considering Both HLA-Peptide Binding and Immunogenicity》

文章地址:

https://www.frontiersin.org/articles/10.3389/fimmu.2019.02559/full

源码地址:

https://github.com/jiujiezz/deephlapan
在这里插入图片描述

论文摘要:

Neoantigens play important roles in cancer immunotherapy. Current methods used for neoantigen prediction focus on the binding between human leukocyte antigens (HLAs) and peptides, which is insufficient for high-confidence neoantigen prediction. In this study, we apply deep learning techniques to predict neoantigens considering both the possibility of HLA-peptide binding (binding model) and the potential immunogenicity (immunogenicity model) of the peptide-HLA complex (pHLA). The binding model achieves comparable performance with other well-acknowledged tools on the latest Immune Epitope Database (IEDB) benchmark datasets and an independent mass spectrometry (MS) dataset. The immunogenicity model could significantly improve the prediction precision of neoantigens. The further application of our method to the mutations with pre-existing T-cell responses indicating its feasibility in clinical application.

新抗原在肿瘤免疫治疗中起着重要作用。目前用于新抗原预测的方法主要集中在人类白细胞抗原(HLA)和肽之间的结合,这对于高置信度的新抗原预测是不够的。在本研究中,我们应用深度学习技术预测新抗原,同时考虑HLA肽结合(结合模型)的可能性和肽-HLA复合物(pHLA)的潜在免疫原性(免疫原性模型)。在最新的免疫表位数据库(IEDB)基准数据集和独立质谱(MS)数据集上,结合模型与其他公认的工具实现了相当的性能。免疫原性模型能显著提高新抗原的预测精度。我们的方法进一步应用于已有T细胞反应的突变,表明其在临床应用中的可行性。


论文主要工作:

在本研究中,论文作者开发了一种新的基于循环神经网络(RNN)的新抗原预测方法,名为DeepHLApan,该方法考虑了HLA肽对之间的结合和pHLA的潜在免疫原性。DeepHLApan由两个模型组成:用于预测肽通过HLA呈现到肿瘤细胞膜的可能性的结合模型和用于预测pHLA诱导T细胞活化的可能性的免疫原性模型。由于结合数据比免疫原性数据多得多,因此将免疫原性模型的预测分数作为过滤器,并对结合模型的预测分数进行排序,以用于高置信度新抗原识别。DeepHLApan的结合模型在最新的免疫表位数据库(IEDB)基准和独立的MS数据集上实现了与其他著名结合预测工具相当的性能。同时可以确认,免疫原性模型能够显著改善先前发表的工作中其他新抗原预测工具的性能(改善范围为20.5%至55.4%)。进一步将此方法应用于具有预先存在的T细胞应答的突变,并将其中大多数(69%)排在前20位,低于百万分之转录本(TPM)>2的表达阈值。这些结果表明,将结合模型和免疫原性模型结合起来的DeepHLApan有助于高置信度新抗原预测,并可能进一步促进肿瘤免疫治疗的实践。
以下图片来源于论文

在这里插入图片描述在这里插入图片描述在这里插入图片描述

在这里插入图片描述
在这里插入图片描述


接下来的任务:
  1. 下载代码,尝试运行
  2. 阅读论文,学习算法
  3. 分析具体代码

基本名词解释:

neoantigen:癌症细胞在基因变异的基础上产生的带有特异性氨基酸序列变异的蛋白被称为“新抗原”。
MHC:主要组织相容性复合体(major histocompatibility complex,MHC) 是一组编码动物主要组织相容性抗原的基因群的统称。人类的MHC被称为HLA(human leukocyte antigen,HLA), 即人白细胞抗原。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值