![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
山东大学2019级软件工程应用与实践
文章平均质量分 76
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题
Haws001
这个作者很懒,什么都没留下…
展开
-
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题
我的工作为:肽与HLA分子结合预测研究DeepHLApan: A Deep Learning Approach for Neoantigen Prediction Considering Both HLA-Peptide Binding and Immunogenicity原创 2021-09-29 21:19:43 · 427 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(二)
2021SC@SDUSC基于人工智能的多肽药物分析问题——第二周学习记录 代码分析主题:肽与HLA分子结合预测研究代码结构代码分析deephlapan#!/usr/bin/pythonfrom deephlapan.deephlapan_main import *from deephlapan.parse_args import *def main(): (opt,_)=CommandLineParser() deephlapan_main(opt)if __原创 2021-10-08 14:47:07 · 229 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(三)
2021SC@SDUSC基于人工智能的多肽药物分析问题主题:肽与HLA分子结合预测研究(3)代码分析代码结构核心代码接上回deephlapan_main()方法的后半部分deephlapan_main.py result = np.average(predScores, axis=0) result1 = np.average(predScores1, axis=0) with open(WD + '/' + fname + '_predicted_result.csv原创 2021-10-14 21:13:58 · 252 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(四)
2021SC@SDUSC基于人工智能的多肽药物分析问题主题:肽与HLA分子结合预测研究(4)代码分析代码结构attention.pyfrom keras import backend as K, initializers, regularizers, constraintsfrom keras.engine.topology import Layerdef dot_product(x, kernel): if K.backend() == 'tensorflow':原创 2021-10-21 21:56:43 · 253 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(五)
2021SC@SDUSC基于人工智能的多肽药物分析问题主题:肽与HLA分子结合预测研究(5)论文学习循环神经网络用于训练的模型架构由三层双向门控循环单元(BiGRU)和一个注意力层堆叠而成。GRU是RNN的一种变体。与RNN类似,GRU具有循环隐藏状态,以此处理可变长度序列,该状态的每次激活都依赖于前一次的激活。GRU和RNN的区别在于循环隐藏状态的更新,这是克服训练模型中梯度消失或爆炸以捕获长期依赖的核心部分。具体而言,GRU建议推导每个时间步 t 的隐藏状态 hth_tht 的向量表示,如下原创 2021-10-28 20:08:45 · 451 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(六)
2021SC@SDUSC基于人工智能的多肽药物分析问题主题:肽与HLA分子结合预测研究(6)论文学习DeepHLApan的体系结构结合亲和力是HLA肽结合最广泛使用的测量方法。然而,随着用于HLA肽结合检测的高通量方法(例如MS)的发展,出现了大量没有结合亲和力的HLA肽结合数据。在从IEDB收集的绑定数据集中,66.8%的绑定数据未通过绑定亲和力进行测量。随着时间的推移,差距进一步扩大。作者将具有绑定亲和力的绑定数据转换为二进制模型,以创建一个只提供绑定或不绑定结果的模型。此外,pHLA的潜在原创 2021-11-04 21:57:32 · 372 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(七)
2021SC@SDUSC基于人工智能的多肽药物分析问题主题:蛋白质预训练模型学习论文:《ProtTrans: Towards Cracking the Language of Life’s Code Through Self-Supervised Learning》文章地址:https://www.biorxiv.org/content/10.1101/2020.07.12.199554v3源码地址:https://github.com/agemagician/ProtTrans摘要:原创 2021-11-11 22:58:18 · 1146 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(八)
2021SC@SDUSC基于人工智能的多肽药物分析问题主题:蛋白质预训练模型(2)代码分析根据使用方法,将按照以上顺序对每部分代码进行分析。特征提取 : Embedding SectionProtTrans/Embedding/Onnx/ProtBert-BFD.ipynbONNX简介:Open Neural Network Exchange(ONNX,开放神经网络交换)格式,是一个用于表示深度学习模型的标准,可使模型在不同框架之间进行转移。ONNX是一种针对机器学习所设计的开放式的文件格原创 2021-11-18 23:33:48 · 753 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(九)
2021SC@SDUSC基于人工智能的多肽药物分析问题主题:蛋白质预训练模型(3)代码分析细调: Fine Tuning Sectionimport torchfrom transformers import AutoTokenizer, Trainer, TrainingArguments, AutoModelForTokenClassification, BertTokenizerFast, EvalPredictionfrom torch.utils.data import Datase原创 2021-11-26 18:35:12 · 455 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(十)
2021SC@SDUSC基于人工智能的多肽药物分析问题主题:蛋白质预训练模型(4)代码分析Prediction SectionProtTrans/Prediction/ProtBert-BFD-Predict-SS3.ipynbfrom transformers import AutoTokenizer, AutoModelForTokenClassification, TokenClassificationPipelineimport repipeline = TokenClassif原创 2021-12-02 23:15:41 · 316 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(十一)
2021SC@SDUSC基于人工智能的多肽药物分析问题主题:蛋白质预训练模型(5)代码分析 Visualization SectionProtTrans/Visualization/ProtAlbert_attention_head_view.ipynb加载必要的库,包括 huggingface 和 bertvis transformerimport torchfrom transformers import AlbertTokenizer, AlbertModelfrom bertviz原创 2021-12-11 00:18:33 · 880 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(十二)
2021SC@SDUSC基于人工智能的多肽药物分析问题主题:蛋白质预训练模型(6)代码分析Benchmark SectionProtTrans/Benchmark/ProtAlbert.ipynb加载必要的库,包括 huggingface transformerimport torchfrom transformers import AlbertModelimport timefrom datetime import timedeltaimport osimport requests原创 2021-12-16 20:54:02 · 1300 阅读 · 0 评论 -
山东大学2019级软件工程应用与实践——基于人工智能的多肽药物分析问题(十三)
2021SC@SDUSC基于人工智能的多肽药物分析问题主题:蛋白质预训练模型(7)原始下游预测二级结构预测与其他蛋白质语言模型的对比关于ProtT5-XL-UniRef50(称为ProtT5-XL-U50)的重要注意事项:所有性能仅使用从底层T5模型的编码器侧提取的嵌入件进行测量,如下所述。此外,还以半精度模式(model.half())进行了实验,以加快嵌入生成的速度。以半精度运行时,在任何实验中均未观察到性能下降。论文阅读蛋白质语言模型到达上限了吗?将NLP技术应用到蛋白质中,为原创 2021-12-24 23:55:12 · 3194 阅读 · 2 评论