![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
DNA/RNA位点预测
文章平均质量分 83
风灬陌
风过无痕,陌路红尘
展开
-
论文解读:《DanQ:用于量化 DNA 序列功能的混合卷积和递归深度神经网络》
在广泛的基因组学领域中,对 DNA 序列的特性和功能进行建模是一项重要但具有挑战性的任务。这项任务对于非编码 DNA 来说尤其困难,其中绝大多数在功能方面仍然知之甚少。一个强大的非编码 DNA 功能预测模型可以为基础科学和转化研究带来巨大的好处,因为超过 98% 的人类基因组是非编码的,而 93% 的疾病相关变异位于这些区域。为了满足这一需求,作者提 出了 DanQ,这是一种新颖的混合卷积和双向长短期记忆递归神经网络框架,用于从头开始预测非编码函数。翻译 2022-09-17 16:05:29 · 1334 阅读 · 0 评论 -
论文解读:《使用非深度与深度学习方法识别mRNA中的N4乙酰胞苷 (ac4C)》
N4乙酰胞苷(ac4C)是mRNA的一种转录后修饰,是mRNA的一种成分,在mRNA的稳定性控制和翻译中起重要作用。 mRNA 变化的 ac4C 方法对于传统的实验室实验来说仍然不简单、耗时或具有成本效益。因此,作者开发了 DL-ac4C,这是一种基于 CNN 的用于 ac4C 识别的深度学习模型。在这项研究中,DL-ac4C 方法(深度学习)与非深度学习(机器学习)方法中的回归和支持向量机进行了比较。结果表明,DL-ac4C 比以前使用的方法更先进。......翻译 2022-08-27 16:39:03 · 597 阅读 · 0 评论 -
论文解读:《SDM6A:基于Web的集成机器学习框架,用于预测水稻基因组中的6mA位点》
论文解读:《SDM6A: A Web-Based Integrative Machine-Learning Framework for Predicting 6mA Sites in the Rice Genome》1.文章概括2.介绍文章链接:https://www.sciencedirect.com/science/article/pii/S2162253119302240DOI:https://doi.org/10.1016/j.omtn.2019.08.011服务器:http://thegle翻译 2020-11-24 19:56:47 · 895 阅读 · 5 评论 -
论文解读:《PACES:mRNA中N4乙酰胞苷(ac4C)修饰位点的预测》
Ac4C是高度保守的RNA修饰,并且是mRNA中描述的第一个乙酰化事件。已经证明mRNA中的ac4C参与了mRNA稳定性,加工和翻译的调控,但是ac4C起作用的确切方式仍不清楚。此外,ac4C以生理相关水平广泛分布在人类转录组内,到目前为止,实验仅检测到一小部分修饰序列。在这项研究中,作者开发了人类mRNA中ac4C位点的预测因子,称为PACES,以帮助挖掘可能的修饰基序。PACES结合了两个随机森林分类器:PSDSP和KNF。使用基因组序列作为输入,PACES会根据训练模型给出可能的修饰。翻译 2020-10-12 17:04:47 · 3897 阅读 · 0 评论 -
使用python简单实现K核苷酸频率(KNF,k-nucleotide frequencies)或K-mer频率
K核苷酸频率(KNF,k-nucleotide frequencies)或K-mer频率KNF描述了序列中存在k个核苷酸的所有可能的多核苷酸的频率。原创 2022-05-17 00:20:27 · 1032 阅读 · 3 评论 -
论文解读:《一种利用二核苷酸One-hot编码器识别水稻基因组中N6甲基腺嘌呤位点的卷积神经网络》
N6-甲基腺嘌呤(N6-Methyladenine,m6A)是重要的表观遗传修饰之一,与各种DNA过程的控制有关。通过传统的方法进行全基因组m6A分析是基础,但需要很长时间。作者提出了一个新的方案:iRicem6A-CNN,用于识别水稻基因组中的m6A位点,该方案采用二核苷酸(2-mer)One-hot编码技术,通过卷积神经网络产生输入张量进行预测,五倍交叉验证和独立测试的预测精度(ACC)分别达到了93.82% 和96.19% ,表现优于其他可用的预测器。翻译 2022-03-09 20:46:06 · 1492 阅读 · 0 评论 -
论文解读:《利用注意力机制提高DNA的N6-甲基腺嘌呤位点的鉴定》
DNA N6-甲基腺嘌呤是一种重要的DNA修饰类型,在多种生物学过程中发挥着重要作用。本研究利用双向短时记忆技术和自注意力机制分别从DNA序列中提取关键位置信息,建立了两个新的基于深度学习的模型,用于改进N6-甲基腺嘌呤(N6-methyladenine,6mA)位点的预测。两种方法的表现均以模式生物拟南芥(Arabidopsis thaliana)和黑腹果蝇(Drosophila melanogaster)为基准,并作出评估。翻译 2022-02-08 21:27:01 · 1760 阅读 · 0 评论 -
论文解读:《i4mC-Deep: 利用具有化学特性的深度学习方法,对 N4-甲基胞嘧啶位点进行智能预测》
DNA受到N4-甲基胞嘧啶(4mC)分子的表观遗传修饰。N4-甲基胞嘧啶在DNA修复和复制中起重要作用,保护宿主DNA免受降解,调节DNA表达。目前的实验技术昂贵又费力。传统的基于机器学习的方法依赖于手工提取的特征,但是新方法通过利用学习特性而节省了时间和计算成本。在这项研究中,我们提出了i4mC-Deep,这是一个基于卷积神经网络(CNN)的智能预测器,可以预测DNA样本中的4mC修饰位点。提取DNN序列的核苷酸化学特性和核苷酸密度特征,作为CNN的输入数据。提出的方法的结果优于几个最先进的预测器。翻译 2021-12-23 18:39:14 · 759 阅读 · 0 评论 -
论文解读:《Deep-4mcw2v: 基于序列的预测器用于识别大肠桿菌中的 N4- 甲基胞嘧啶(4mC)位点》
N4-甲基胞嘧啶(4mC)是一种DNA修饰,可以调控多种生物进展,如转录调控、复制和基因表达。精确识别基因组序列中的4mC位点可以提供有关其遗传作用的特定知识。作者开发一个基于深度学习的模型来预测大肠桿菌中的4mC位点。在模型中,DNA序列通过字嵌入技术“ word2vec”进行编码。将所获得的特征输入一维卷积神经网络(CNN) ,从而区分大肠桿菌基因组中的4mC位点和非4mC位点。对独立数据集的检验表明,所提出的模型总体精度(ACC)为0.861,比现有模型高出约4.3%。作者还提供了模型的数据和源代码。翻译 2021-12-11 12:25:07 · 1198 阅读 · 0 评论 -
论文解读:《提高N7-甲基鸟苷(m7G)位点预测性能的迭代特征表示方法》
N7-甲基鸟苷 (m7G) 是一种重要的表观遗传修饰,在基因表达调控中发挥着重要作用。尽管高通量实验方法能够精确定位 m7G 位点,但它们仍然成本效益低。作者通过使用迭代特征表示算法,开发了一种基于机器学习的方法:m7G-IFL,用于识别 m7G 位点。对 m7G-IFL 进行了评估并与现有的预测方法进行了比较。结果表明,m7G-IFL方法在识别 m7G 位点的准确性方面优于现有的预测方法。通过分析和比较预测方法中使用的特征,作者发现特征空间中的正负样本比现有特征空间中的分离度更高。翻译 2021-08-12 17:34:23 · 1972 阅读 · 2 评论 -
论文解读:《开发一种基于多层深度学习的预测模型来鉴定DNA N4-甲基胞嘧啶修饰》
随着高通量技术的发展,在细菌中发现了4mC,发现在保护基因组免受限制性改性(R-M)系统中的侵袭中起重要作用。前人的方法改进了识别4mC位点的性能,但是数据集采用的太少,不能充分反映整个基因组并建立好性能的模型。Deep4mCPred是第一个基于深度学习的预测方法,集成了残差网络(ResNet)和双向长短时记忆网络(BiLSTM)来构建多层深度学习预测模型。在训练预测模型时不需要指定特征,可以自动学习高级功能并捕获4mC位点的特征,有益于区分非4mC和真4mC位点。翻译 2021-08-08 10:19:06 · 633 阅读 · 0 评论 -
K核苷酸频率(KNF,k-nucleotide frequencies)或K-mer频率
K核苷酸频率(KNF,k-nucleotide frequencies)或K-mer频率KNF描述了序列中存在k个核苷酸的所有可能的多核苷酸的频率。如果k=2,则计算的为双核苷酸频率(即AA、AT、AG、AC、……TT),共42=16种;如果k=3,则计算的为双核苷酸频率(即AAA、AAT、AAG、AAC、……TTT),共43=64种;以此类推。K-mer频率亦如此。方法一:#提取核苷酸类型(排列组合)from itertools import productdef nucleotide_typ原创 2021-06-10 20:53:19 · 2915 阅读 · 3 评论