自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(65)
  • 收藏
  • 关注

翻译 论文解读:《用于配体结合亲和力预测的基准主动学习协议》

主动学习(Active learning,AL)已成为计算药物发现的强大工具,能够从庞大的分子库中识别顶级结合剂。作者使用不同目标的四个亲和力数据集(TYK2、USP7、D2R、Mpro)来系统评估机器学习模型[高斯过程(Gaussian process,GP)模型和模型]、样本选择协议的性能,以及基于描述模型总体预测能力的指标(R2、Spearman秩、均方根误差)以及前2%/5%粘合剂的准确识别(Recall,F1得分)的批量大小。

2024-03-19 01:24:19 26 1

翻译 论文解读:《AFSE:基于深度图学习模型提高靶向GPCR蛋白配体生物活性的泛化能力》

配体分子自然地构成了图形结构。最近,许多优秀的深度图学习(deep graph learning,DGL)方法被提出并用于模拟配体生物活性,这对于从感兴趣的化合物数据库中虚拟筛选药物命中至关重要。然而,这些训练有素的 DGL 模型通常很难在真实场景中实现候选药物虚拟筛选的令人满意的性能。主要挑战包括训练模型的数据集规模小且有偏差,内部活跃的复杂案例会恶化模型性能。这些挑战将导致预测器过度拟合训练数据,并且在真实的虚拟筛选场景中泛化能力较差。

2024-01-02 20:55:01 106

翻译 论文解读:《自动配体搜索器的介绍》

自动配体搜索器 (The Automated Ligand Searcher,ALISE)被设计为自动计算药物发现工具。为了估算配体与受体的结合自由能,ALISE 包括一个三阶段工作流程,每个阶段都涉及复杂的计算方法:分别是分子对接、分子动力学和自由能扰动。为了缩小潜在配体的数量,性能较差的配体被逐渐隔离出来。ALISE 的性能和可用性以包含已知的 HIV 蛋白酶活性配体和诱​​饵的案例研究为基准。

2023-12-27 11:39:33 83

翻译 论文解读:《D3CARP:一个综合平台,具有基于多重构象的对接、配体相似性搜索和深度学习方法,用于目标预测和虚拟筛选》》

在传统的药物发现中,耗费资源和时间的生物实验是不可避免的,这直接推动了各种药物-靶点相互作用(DTI)预测计算算法和工具的发展。为了提高预测的可靠性,人们非常期待一个全面的平台,因为之前报道的一些网络服务器规模小,方法单一,甚至停止服务。本研究融合了基于多构象的对接、2D/3D配体相似度搜索和深度学习方法,构建了一个用于靶点预测和虚拟筛选的综合网络服务器D3CARP。具体而言,9352个构象与1970个靶标的阳性对照用于分子对接,约200万个靶标-配体对用于2D/3D配体相似性搜索和深度学习。

2023-11-30 01:30:53 203

翻译 论文解读:《ETDock:一种基于等变transformer的蛋白质-配体对接方法》

预测蛋白质和配体之间的对接对于药物发现来说是一项至关重要且具有挑战性的任务。然而,传统的对接方法主要依赖于评分函数,而基于深度学习的对接方法通常忽略了蛋白质和配体的3D空间信息以及配体的图级特征,这限制了其性能。为了解决这些限制,作者提出了一种用于蛋白质-配体对接构象预测的等变transformer神经网络。该方法涉及通过特征处理融合配体图级特征,然后使用作者提出的 TAMformer 模块学习配体和蛋白质表示。此外,作者还采用基于预测距离矩阵的迭代优化方法来生成精细的配体构象。

2023-11-01 21:52:42 216

翻译 论文解读:《DataPype:用于计算机辅助药物设计的全自动统一软件平台》

随着计算机辅助药物设计(computer-aided drug design,CADD)的出现,数千种分子的传统物理测试现已被靶向药物发现所取代,其中潜在的生物活性分子在物理合成之前由计算机软件预测。然而,尽管这是一个重大突破,CADD仍然面临各种限制和挑战。小分子数据的可用性日益增加,因此需要简化来自不同数据库的数据来源,并将数据处理和清理自动化为可供多个CADD软件应用程序使用的形式。有几个独立的软件包可以帮助药物设计者,每个软件包都有自己特定的应用,需要专业知识和专业知识才能实现最佳使用。

2023-10-25 21:54:48 262

翻译 论文解读:《AttenSyn:基于注意力的深度图神经网络用于抗癌协同药物组合预测》

确定协同药物组合对于治疗各种复杂疾病同时避免严重的药物间相互作用至关重要。尽管已经提出了几种计算方法,但它们高度依赖手工特征工程,无法学习药物对之间更好的交互信息,容易导致性能相对较低。最近,深度学习方法,特别是图神经网络,在该领域得到了广泛的发展,并证明了其解决复杂生物问题的能力。在这项研究中,作者基于注意力的深度图神经网络提出了一种用于准确预测协同药物组合的方法:AttenSyn。

2023-09-26 22:38:34 394

翻译 论文解读:《GPApred:第一个使用基于序列的最佳特征识别具有 LPXTG 样motif蛋白质的计算预测器》

革兰氏阳性菌的细胞表面蛋白参与许多重要的生物学功能,包括宿主细胞的感染。由于它们的毒性,这些蛋白质也被认为是潜在药物或疫苗靶点的有力候选者。在革兰氏阳性菌的各种细胞表面蛋白中,LPXTG 样蛋白是一个主要类别。多种 LPXTG 样蛋白已通过实验得到表征;然而,由于广泛的细菌基因组测序没有适当的注释,公共数据库中的细菌数量有所增加。在缺乏实验表征的情况下,识别和注释这些序列极具挑战性。因此,在这项研究中,我们开发了第一个基于机器学习的预测器,称为: GPApred,它可以从一级序列中识别 LPXTG 样蛋白。

2023-08-03 22:56:14 413

翻译 论文解读:《NeRD:一种通过整合多维数据来预测药物细胞反应的多通道神经网络》

考虑到肿瘤的异质性,预测每个个体的药物反应是精准医学的关键问题。各类药物信息学和多组学数据的积累有助于开发有效的药物反应预测模型。然而,高质量数据源的选择和合适方法的设计仍然是一个挑战。本文设计了NeRD,一种基于PRISM药物反应数据库的多维数据集成模型,用于预测药物的细胞反应。

2023-06-28 21:18:05 378

翻译 论文解读:《通过结合局部和全局深度卷积神经网络预测 RNA-蛋白质结合位点和基序》

RNA 结合蛋白占真核蛋白质组的5-10%,并在许多生物过程中发挥关键作用。RBP结合位点的实验检测仍然是耗时且成本高的。而使用从现有注释知识中学习的模式对RBP结合位点进行计算预测是一种快速方法。从生物学的角度来看,源自局部序列的局部结构上下文将被特定的RBP识别。然而,在使用深度学习的计算建模中,只使用了整个RNA序列的全局表示。到目前为止,在深度模型构建过程中忽略了局部序列信息。在这项研究中,作者提出了一种计算方法 iDeepE,通过结合全局和局部CNN从RNA序列预测RNA-蛋白质结合位点。

2023-06-27 18:00:30 437 6

翻译 论文解读:《MCANet:基于共享权重的药物-靶标相互作用预测的多头交叉注意力网络》

准确有效的预测药物-靶标相互作用可以大大缩短药物开发周期,降低药物开发成本。作者提出了一个端到端,资源高效的深度学习模型,称为MCANet,它从药物分子和氨基酸序列中提取特征,并使用这些特征进行DTI预测。该模型采用基于共享权重的多头交叉注意力模块高效提取药物与靶标之间的鲁棒表示特征,并采用PolyLoss损失函数改善过拟合问题和类不平衡问题。与现有仅使用蛋白质序列和药物分子序列进行DTI预测的最先进方法相比,所提出的MCANet在六个不同的数据集上取得了领先的性能。

2023-05-31 20:57:25 773 5

翻译 论文解读:《DeepFormer:一种基于卷积神经网络和连贯注意力机制的混合网络,用于识别 DNA 序列的功能》

准确识别DNA序列的功能是基因组领域一项重要且具有挑战性的任务。到目前为止,深度学习已广泛应用于DNA序列的功能分析,包括DeepSEA,DanQ,DeepATT和TBiNet。然而,这些方法存在计算复杂度高、未充分考虑染色质特征之间远距离相互作用等问题,从而影响预测精度。在这项工作中,作者提出了一种混合深度神经网络模型,称为DeepFormer,

2023-05-10 19:45:16 763 1

翻译 论文解读:《LncReader:使用多头自注意机制识别双功能长链非编码 RNA》

具有蛋白质编码和非编码功能的长链非编码核糖核酸(RNA;LncRNA)被称为“双功能 lncRNA”。最近,双功能 lncRNA 已被确定参与各种基本细胞过程。然而,除了耗时且特定于细胞类型的实验外,几乎没有用于预测双功能 lncRNA 的计算机方法。所以作者开发了一个具有多头自注意机制的深度学习模型:LncReader,用来识别双功能 lncRNA。实验结果表明,与使用之前报告的 cncRNAdb 项目的基准数据集的各种经典机器学习方法相比,LncReader 显示出多种优势。

2023-04-11 20:57:50 324

翻译 论文解读:《基于有序位置编码的深度学习和机器学习集成模型的抗癌肽预测》

抗癌肽(ACPs)是一类已被证明具有抗癌活性的肽。使用ACP来预防癌症可能是传统癌症治疗的可行替代方案,因为它们更安全,并显示出更高的选择性。作者提出了一种利用序列信息预测ACP的计算方法。该过程包括肽序列的输入,利用位置信息进行序列编码和手工特征提取,最后进行特征选择。整个模型由两个模块组成,包括深度学习和机器学习算法。深度学习模块包含两个通道:BiLSTM和CNN。最后,作者针对得出模型集成层的三条路径,对三个模型的分类结果进行了投票。该研究为ACP预测提供了一种新的方法,并提供了一个有前景的性能。

2023-02-18 23:35:40 884

翻译 论文解读:《ILGBMSH:基于集成学习算法用于shRNA目标预测的可解释分类模型》

shRNA介导的基因沉默是实现RNA干扰的重要技术,设计有效可靠的shRNA分子起着至关重要的作用。作者基于ILGBMSH提出了一个可解释的分类模型,用于shRNA目标预测。作者并没有仅仅利用shRNA序列特征,而是提取了554个生物学和深度学习特征,这些特征在之前的shRNA预测研究中没有考虑到。与最先进的shRNA目标预测模型进行了比较,评估了模型的性能。还从模型的参数和SHAP来研究特征解释,这为从模型中获得生物学见解提供了依据。最后进行了敲低实验,实验结果与预测完全一致。

2023-01-01 21:29:29 500

翻译 论文解读:《iHSP-PseRAAAC:使用伪还原氨基酸字母组成识别热休克蛋白家族》

热休克蛋白 (HSP) 是一种功能相关的蛋白质,存在于所有生物体中,包括原核生物和真核生物。它们在蛋白质-蛋白质相互作用中起着重要作用,它们的功能障碍可能导致各种危及生命的疾病。根据它们的功能,HSP 通常分为六个家族。作者提出了一种名为iHSP-PseRAAAC的方法,它通过将简化的氨基酸字母表信息整合到伪氨基酸组成的一般形式中。引入简化氨基酸字母表的优势是能够避免统计预测中维度灾难或过度拟合问题。

2022-12-15 19:06:38 125

翻译 论文解读:《DeepIDC:基于异构信息和深度学习的注射用药物组合预测框架》

在临床实践中,注射药物组合(IDC)通常能为患者提供良好的治疗效果。大量临床研究直接表明,不适当的 IDC 会产生不良药物事件 (ADE)。注射剂的临床应用越来越多,很多注射剂缺乏相关的组合信息。经验丰富的临床药师仍然需要参与循证药物决策、监测用药安全和管理药物相互作用。同时,大量的注射对和剂量组合限制了详尽的筛选。所以,作者提出了一个称为 DeepIDC 的预测框架,它可以方便地筛选 IDC 使用深度学习的异构信息的可行性。这是第一个识别 IDC 的特定预测框架。

2022-12-10 21:46:14 347

翻译 论文解读:《将生物医学数据集成和格式化为 Bioteque 中预先计算的知识图嵌入》

生物医学数据正在快速积累,将其整合到一个统一的框架中是一项重大挑战,因此可以同时考虑给定生物事件的多个视图。作者提出了 Bioteque,从巨大的知识图派生的预先计算的生物医学描述符,显示超过 45 万个生物实体和它们之间的 3000 万个关系。Bioteque 整合、协调和格式化从 150 多个数据源收集的数据,包括由 67 种类型的关联(例如,“药物治疗疾病”、“基因与基因相互作用”)链接的 12 种生物实体(例如,基因、疾病、药物)。

2022-11-28 19:40:18 959

翻译 论文解读:《CoaDTI:基于多模态共同注意的药物-靶标相互作用注释框架》

DTI的鉴定对于计算机药物发现起着至关重要的作用,其中药物是化学分子,目标是binding pockets中的蛋白质残基。作者基于端到端的深度学习框架开发了一个名为 CoaDTI 的方法,用来提高药物靶标注释的效率和可解释性。 CoaDTI 结合了共同注意机制模拟来自药物模态和蛋白质模态的相互作用信息。特别的,CoaDTI 结合了 transformer 从原始氨基酸序列中学习蛋白质表示,并结合了 GraphSAGE 从 SMILES 中提取分子图特征。

2022-11-20 21:47:31 1245 8

翻译 论文解读:《基于知识的BERT:一种像计算化学家一样提取分子特征的方法》

基于机器学习算法的分子性质预测模型已成为在药物发现早期阶段对没有前途的先导分子进行分类的重要工具。与主流的基于描述符和图的分子性质预测方法相比,基于 SMILES 的方法无需人类专家知识即可直接从 SMILES 中提取分子特征,但它们需要强大的特征提取算法和更大的训练数据量,这使得基于 SMILES 的方法不太受欢迎。作者展示了预训练在促进重要药物特性预测方面的巨大潜力。

2022-10-30 21:17:58 738 2

翻译 论文解读:《RELATION:基于结构的药物从头设计的深度生成模型》

基于深度学习的药物从头分子设计最近获得了相当大的关注。许多基于 DL 的生成模型已成功开发用于设计新分子,但其中大多数是以配体为中心的,并且目标结合口袋的 3D 几何形状在分子生成中的作用尚未得到充分利用。本文提出了一种新的基于 3D 的生成模型,称为 RELATION。在 RELATION 模型中,双向迁移学习(BiTL) 算法专门设计用于提取蛋白质-配体复合物的所需几何特征,并将其转移到潜在空间进行分子生成。

2022-10-28 16:41:01 502 5

翻译 论文解读:《FusionDTA:基于注意力的特征融合和知识净化用于药物-靶点结合亲和力预测》

药物靶点亲和力(drug-target affinity,DTA)的预测在药物发现中发挥着越来越重要的作用。如今,许多预测方法都集中在药物和蛋白质的特征编码上,而忽略了特征聚合的重要性。然而,越来越复杂的编码器网络会导致隐含信息的丢失或模型尺寸过大。为此,作者提出了一种基于深度学习的方法,即 FusionDTA。对于隐含信息的丢失,使用一种新颖的多头线性注意机制来代替粗糙的池化方法。这允许 FusionDTA 基于注意力权重聚合全局信息,而不是像 max pooling 那样选择最大的一个。

2022-10-09 20:04:26 1235 1

翻译 论文解读:《通过深度学习从转录谱预测药物疗效》

基于靶标蛋白的药物研发是一种成功的策略,但许多疾病机理或者发病机制缺乏明显的靶点来实现这种方法。为了克服这一挑战,该研究描述了一种基于深度学习和基因指纹的药效预测系统 (DLEPS),该系统使用疾病相关基因表达谱的变化作为输入来识别候选药物。DLEPS 使用 L1000 项目中化学诱导的转录谱变化进行训练。该研究发现,以前未知的转录谱的变化Pearson相关系数被预测为 0.74。该研究在3种代谢性疾病中进行了验证,并在小鼠疾病模型中对顶级候选药物进行了实验测试。

2022-09-25 18:02:15 823

翻译 论文解读:《PredNTS:通过整合多个序列特征来改进和稳健地预测硝基酪氨酸位点》

由多种活性氮物质产生的硝基酪氨酸是一种蛋白质翻译后修饰。作者通过整合多个序列特征(包括 K-mer、CKSAAP、AAindex 和二进制编码方案)开发了一种计算预测器 PredNTS。使用随机森林分类器通过递归特征消除方法选择重要特征。最后,线性组合了不同使用单一编码的 RF 模型生成的连续随机森林 (RF) 概率分数。由此产生的 PredNTS 预测器在五折交叉验证中AUC = 0.910。它在全面和独立的数据集上优于现有的预测器。此外,作者还研究了几种机器学习算法,以证明所采用的 RF 算法的优越性。

2022-09-17 22:16:46 625

翻译 论文解读:《DanQ:用于量化 DNA 序列功能的混合卷积和递归深度神经网络》

在广泛的基因组学领域中,对 DNA 序列的特性和功能进行建模是一项重要但具有挑战性的任务。这项任务对于非编码 DNA 来说尤其困难,其中绝大多数在功能方面仍然知之甚少。一个强大的非编码 DNA 功能预测模型可以为基础科学和转化研究带来巨大的好处,因为超过 98% 的人类基因组是非编码的,而 93% 的疾病相关变异位于这些区域。为了满足这一需求,作者提 出了 DanQ,这是一种新颖的混合卷积和双向长短期记忆递归神经网络框架,用于从头开始预测非编码函数。

2022-09-17 16:05:29 1196

翻译 论文解读:《PLP_FS:使用支持向量机和融合多个 F_Score 特征选择来预测蛋白质中的赖氨酸磷酸甘油化位点》

磷酸甘油化是一种新发现的翻译后修饰 (PTM),已验证出其在蛋白质的构建和功能特性以及危险的人类疾病中的重要作用。目前有少量计算模型可用于识别磷酸甘油化位点,这些位点无法达到令人满意的预测能力。因此,作者设计并构建了一个名为 PLP_FS 的有效预测因子来识别本研究中的磷酸甘油化位点。为达到训练目的,通过融合多种F_Score特征选择技术,从三种基于序列的特征提取方法生成的特征中获得最优的特征集数量,并将其与支持向量机分类技术拟合到预测模型中。另一方面,还实施了K最近邻清洗和SMOTE方法来平衡基准数据集。

2022-08-28 15:41:35 309

翻译 论文解读:《使用非深度与深度学习方法识别mRNA中的N4乙酰胞苷 (ac4C)》

N4乙酰胞苷(ac4C)是mRNA的一种转录后修饰,是mRNA的一种成分,在mRNA的稳定性控制和翻译中起重要作用。 mRNA 变化的 ac4C 方法对于传统的实验室实验来说仍然不简单、耗时或具有成本效益。因此,作者开发了 DL-ac4C,这是一种基于 CNN 的用于 ac4C 识别的深度学习模型。在这项研究中,DL-ac4C 方法(深度学习)与非深度学习(机器学习)方法中的回归和支持向量机进行了比较。结果表明,DL-ac4C 比以前使用的方法更先进。......

2022-08-27 16:39:03 545

翻译 论文解读:《Multi-Branch-CNN:使用多分支卷积神经网络对离子通道相互作用肽进行分类》

对离子通道具有高亲和力的配体肽对于调节跨质膜的离子通量至关重要。在这项工作中,作者开发了 Multi-Branch-CNN,这是一种具有多个输入分支的 CNN 方法,用于从特征内和特征间类型中识别三种类型的离子通道肽结合剂(钠、钾和钙)。为此,作者在两个测试集上测试了开发的模型:一个通用测试集,包括与训练集具有不同相似度的序列;以及一个新的测试集,仅包含与训练集序列几乎没有相似之处的序列。最终的实验结果表明,Multi-Branch-CNN 方法的性能优于13种传统机器学习算法。

2022-08-22 16:19:40 1654

翻译 论文解读:《DeepKla:一种基于注意力机制的深度神经网络,用于蛋白质赖氨酸乳酸化位点预测》

作为一种新发现的蛋白质翻译后修饰,赖氨酸乳酸化(Kla)在各种细胞过程中起着举足轻重的作用。高通量质谱法是检测 Kla 位点的主要方法。然而,与计算方法相比,识别 Kla 位点的实验方法通常既耗时又费力。因此,需要开发一种强大的工具来识别 Kla 站点。为此,作者通过结合嵌入层、卷积神经网络、双向门控循环单元和注意机制层,提出了第一个称为 DeepKla 的计算框架,用于水稻中 Kla 位点预测。综合实验结果证明了 DeepKla 出色的预测能力和鲁棒性。

2022-08-05 16:10:17 1131 6

翻译 论文解读:《iRice-MS:用于检测水稻多型翻译后修饰位点的集成 XGBoost 模型》

翻译后修饰 (PTM) 是指蛋白质生物合成后对蛋白质进行共价和酶促修饰,协调各种生物过程。在蛋白质组规模上检测PTM位点是深入了解其调控机制的关键步骤之一。在这项研究中,作者提出了一种基于XGBoost 的集成方法,称为:iRice-MS,用于识别水稻中的 2-羟基异丁酰化、巴豆酰化、丙二酰化、泛素化、琥珀酰化和乙酰化。对于每个PTM特定模型,作者采用了八种特征编码方案,包括基于序列的特征、基于物理化学性质的特征和基于空间映射信息的特征。从每种编码中识别出最优特征集,并建立它们各自的模型。

2022-08-05 14:49:55 768

翻译 论文解读:《DeepIPs:使用基于深度学习的方法对SARS-CoV-2感染的磷酸化位点进行全面评估和计算识别》

SARS-CoV-2感染在全球的快速传播已经造成了大规模的健康和社会经济危机。识别磷酸化位点是了解SARS-CoV-2感染的分子机制和宿主细胞内途径变化的重要一步。在这项研究中,作者提出了DeepIPs,这是第一个用于识别感染SARS-CoV-2宿主细胞中的磷酸化位点的特定深度学习结构。DeepIPs由最流行的单词嵌入方法和卷积神经网络–长短期记忆网络结构组成,以做出最终的预测。独立测试表明,与其它现有的一般磷酸化位点预测工具相比,DeepIPs提高了预测性能。...

2022-07-21 16:42:24 1003

原创 专利CPC客户端保存文件出现Schema校验失败的解决方法

保存实质审查请求书出现Schema校验失败,会显示有三个错误,分别为年月日,只需按以下方法进行即可解决。

2022-07-04 18:44:49 999

原创 中国专利电子申请网CPC客户端的安装教程

本文详细介绍了CPC客户端的安装需求以及安装流程

2022-07-04 18:08:27 6805

原创 使用python简单实现三种常见的降维方法:PCA、t-SNE和Umap(降到二维进行可视化)

使用python简单实现三种常见的降维方法:PCA、t-SNE和Umap(降到二维进行可视化)

2022-06-19 22:08:09 8605

原创 使用python简单实现K核苷酸频率(KNF,k-nucleotide frequencies)或K-mer频率

K核苷酸频率(KNF,k-nucleotide frequencies)或K-mer频率KNF描述了序列中存在k个核苷酸的所有可能的多核苷酸的频率。

2022-05-17 00:20:27 969 3

原创 使用Python画ROC曲线和PRC曲线

受试者工作特征曲线(Receiver operating characteristic curve,ROC)精确召回曲线(Precision recall curve,PRC)

2022-04-16 09:34:51 3836

原创 常见机器学习模型的便捷使用(Python)

常见的机器学习模型有:逻辑回归(LR)、决策树(DT)、随机梯度下降(SGD)、支持向量机(SVM)、随机森林(RF)、梯度提升决策树(GBDT)、极限梯度提升(XGBoost)和LightGBM。本文介绍了以上八种机器学习模型的便捷使用方法,实现了多个数据可对应多种模型。

2022-04-15 15:40:58 1848

翻译 论文解读:《基于注意力的多标签神经网络用于12种广泛存在的RNA修饰的综合预测和解释》

最近的研究表明,通过转录后RNA修饰的表达转录调控对所有类型的RNA都是至关重要的。精确地确定RNA修饰位点对于理解RNA的功能和调控机制至关重要。作者提出一种方法:MultiRM,可以综合预测和解释转录后RNA修饰。该方法建立在一个基于注意力机制的多标签预测深度学习框架上,MultiRM不仅可以同时预测十二个广泛发生的RNA转录组修饰(m6A,m1A,m5C,m5U,m6Am,m7G,ψ,I,Am,Cm,Gm,Um)的位置,而且还可以返回对正面预测贡献最大的关键序列内容。

2022-03-27 12:50:28 2827 2

翻译 论文解读:《一种利用二核苷酸One-hot编码器识别水稻基因组中N6甲基腺嘌呤位点的卷积神经网络》

N6-甲基腺嘌呤(N6-Methyladenine,m6A)是重要的表观遗传修饰之一,与各种DNA过程的控制有关。通过传统的方法进行全基因组m6A分析是基础,但需要很长时间。作者提出了一个新的方案:iRicem6A-CNN,用于识别水稻基因组中的m6A位点,该方案采用二核苷酸(2-mer)One-hot编码技术,通过卷积神经网络产生输入张量进行预测,五倍交叉验证和独立测试的预测精度(ACC)分别达到了93.82% 和96.19% ,表现优于其他可用的预测器。

2022-03-09 20:46:06 1437

翻译 论文解读:《利用注意力机制提高DNA的N6-甲基腺嘌呤位点的鉴定》

DNA N6-甲基腺嘌呤是一种重要的DNA修饰类型,在多种生物学过程中发挥着重要作用。本研究利用双向短时记忆技术和自注意力机制分别从DNA序列中提取关键位置信息,建立了两个新的基于深度学习的模型,用于改进N6-甲基腺嘌呤(N6-methyladenine,6mA)位点的预测。两种方法的表现均以模式生物拟南芥(Arabidopsis thaliana)和黑腹果蝇(Drosophila melanogaster)为基准,并作出评估。

2022-02-08 21:27:01 1683

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除