蛋白质/肽/氨基酸
文章平均质量分 94
风灬陌
风过无痕,陌路红尘
展开
-
论文解读:《GPApred:第一个使用基于序列的最佳特征识别具有 LPXTG 样motif蛋白质的计算预测器》
革兰氏阳性菌的细胞表面蛋白参与许多重要的生物学功能,包括宿主细胞的感染。由于它们的毒性,这些蛋白质也被认为是潜在药物或疫苗靶点的有力候选者。在革兰氏阳性菌的各种细胞表面蛋白中,LPXTG 样蛋白是一个主要类别。多种 LPXTG 样蛋白已通过实验得到表征;然而,由于广泛的细菌基因组测序没有适当的注释,公共数据库中的细菌数量有所增加。在缺乏实验表征的情况下,识别和注释这些序列极具挑战性。因此,在这项研究中,我们开发了第一个基于机器学习的预测器,称为: GPApred,它可以从一级序列中识别 LPXTG 样蛋白。翻译 2023-08-03 22:56:14 · 573 阅读 · 0 评论 -
论文解读:《LncReader:使用多头自注意机制识别双功能长链非编码 RNA》
具有蛋白质编码和非编码功能的长链非编码核糖核酸(RNA;LncRNA)被称为“双功能 lncRNA”。最近,双功能 lncRNA 已被确定参与各种基本细胞过程。然而,除了耗时且特定于细胞类型的实验外,几乎没有用于预测双功能 lncRNA 的计算机方法。所以作者开发了一个具有多头自注意机制的深度学习模型:LncReader,用来识别双功能 lncRNA。实验结果表明,与使用之前报告的 cncRNAdb 项目的基准数据集的各种经典机器学习方法相比,LncReader 显示出多种优势。翻译 2023-04-11 20:57:50 · 386 阅读 · 0 评论 -
论文解读:《ILGBMSH:基于集成学习算法用于shRNA目标预测的可解释分类模型》
shRNA介导的基因沉默是实现RNA干扰的重要技术,设计有效可靠的shRNA分子起着至关重要的作用。作者基于ILGBMSH提出了一个可解释的分类模型,用于shRNA目标预测。作者并没有仅仅利用shRNA序列特征,而是提取了554个生物学和深度学习特征,这些特征在之前的shRNA预测研究中没有考虑到。与最先进的shRNA目标预测模型进行了比较,评估了模型的性能。还从模型的参数和SHAP来研究特征解释,这为从模型中获得生物学见解提供了依据。最后进行了敲低实验,实验结果与预测完全一致。翻译 2023-01-01 21:29:29 · 535 阅读 · 0 评论 -
论文解读:《iHSP-PseRAAAC:使用伪还原氨基酸字母组成识别热休克蛋白家族》
热休克蛋白 (HSP) 是一种功能相关的蛋白质,存在于所有生物体中,包括原核生物和真核生物。它们在蛋白质-蛋白质相互作用中起着重要作用,它们的功能障碍可能导致各种危及生命的疾病。根据它们的功能,HSP 通常分为六个家族。作者提出了一种名为iHSP-PseRAAAC的方法,它通过将简化的氨基酸字母表信息整合到伪氨基酸组成的一般形式中。引入简化氨基酸字母表的优势是能够避免统计预测中维度灾难或过度拟合问题。翻译 2022-12-15 19:06:38 · 136 阅读 · 0 评论 -
论文解读:《PredNTS:通过整合多个序列特征来改进和稳健地预测硝基酪氨酸位点》
由多种活性氮物质产生的硝基酪氨酸是一种蛋白质翻译后修饰。作者通过整合多个序列特征(包括 K-mer、CKSAAP、AAindex 和二进制编码方案)开发了一种计算预测器 PredNTS。使用随机森林分类器通过递归特征消除方法选择重要特征。最后,线性组合了不同使用单一编码的 RF 模型生成的连续随机森林 (RF) 概率分数。由此产生的 PredNTS 预测器在五折交叉验证中AUC = 0.910。它在全面和独立的数据集上优于现有的预测器。此外,作者还研究了几种机器学习算法,以证明所采用的 RF 算法的优越性。翻译 2022-09-17 22:16:46 · 681 阅读 · 0 评论 -
论文解读:《PLP_FS:使用支持向量机和融合多个 F_Score 特征选择来预测蛋白质中的赖氨酸磷酸甘油化位点》
磷酸甘油化是一种新发现的翻译后修饰 (PTM),已验证出其在蛋白质的构建和功能特性以及危险的人类疾病中的重要作用。目前有少量计算模型可用于识别磷酸甘油化位点,这些位点无法达到令人满意的预测能力。因此,作者设计并构建了一个名为 PLP_FS 的有效预测因子来识别本研究中的磷酸甘油化位点。为达到训练目的,通过融合多种F_Score特征选择技术,从三种基于序列的特征提取方法生成的特征中获得最优的特征集数量,并将其与支持向量机分类技术拟合到预测模型中。另一方面,还实施了K最近邻清洗和SMOTE方法来平衡基准数据集。翻译 2022-08-28 15:41:35 · 382 阅读 · 0 评论 -
论文解读:《DeepKla:一种基于注意力机制的深度神经网络,用于蛋白质赖氨酸乳酸化位点预测》
作为一种新发现的蛋白质翻译后修饰,赖氨酸乳酸化(Kla)在各种细胞过程中起着举足轻重的作用。高通量质谱法是检测 Kla 位点的主要方法。然而,与计算方法相比,识别 Kla 位点的实验方法通常既耗时又费力。因此,需要开发一种强大的工具来识别 Kla 站点。为此,作者通过结合嵌入层、卷积神经网络、双向门控循环单元和注意机制层,提出了第一个称为 DeepKla 的计算框架,用于水稻中 Kla 位点预测。综合实验结果证明了 DeepKla 出色的预测能力和鲁棒性。翻译 2022-08-05 16:10:17 · 1293 阅读 · 6 评论 -
论文解读:《iRice-MS:用于检测水稻多型翻译后修饰位点的集成 XGBoost 模型》
翻译后修饰 (PTM) 是指蛋白质生物合成后对蛋白质进行共价和酶促修饰,协调各种生物过程。在蛋白质组规模上检测PTM位点是深入了解其调控机制的关键步骤之一。在这项研究中,作者提出了一种基于XGBoost 的集成方法,称为:iRice-MS,用于识别水稻中的 2-羟基异丁酰化、巴豆酰化、丙二酰化、泛素化、琥珀酰化和乙酰化。对于每个PTM特定模型,作者采用了八种特征编码方案,包括基于序列的特征、基于物理化学性质的特征和基于空间映射信息的特征。从每种编码中识别出最优特征集,并建立它们各自的模型。翻译 2022-08-05 14:49:55 · 844 阅读 · 0 评论 -
论文解读:《DeepIPs:使用基于深度学习的方法对SARS-CoV-2感染的磷酸化位点进行全面评估和计算识别》
SARS-CoV-2感染在全球的快速传播已经造成了大规模的健康和社会经济危机。识别磷酸化位点是了解SARS-CoV-2感染的分子机制和宿主细胞内途径变化的重要一步。在这项研究中,作者提出了DeepIPs,这是第一个用于识别感染SARS-CoV-2宿主细胞中的磷酸化位点的特定深度学习结构。DeepIPs由最流行的单词嵌入方法和卷积神经网络–长短期记忆网络结构组成,以做出最终的预测。独立测试表明,与其它现有的一般磷酸化位点预测工具相比,DeepIPs提高了预测性能。...翻译 2022-07-21 16:42:24 · 1049 阅读 · 0 评论 -
论文解读:《BERT4Bitter:一种基于transformer(BERT)双向编码器表示用于改善苦肽预测的基础模型》
后基因组时代有大量的新可用肽序列,鉴定新型苦肽的自动计算模型的发展非常有必要。作者提出的BERT4Bitter是基于转换器(BERT)的双向编码器表示,用于预测直接来自氨基酸序列的苦肽,而不使用任何结构信息,这是第一次采用基于BERT的模型来识别苦肽。文章地址:https://academic.oup.com/bioinformatics/advance-article-abstract/doi/10.1093/bioinformatics/btab133/615171翻译 2021-07-10 16:46:57 · 1024 阅读 · 0 评论