自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

翻译 Large language models generate functional protein sequences across diverse families

深度学习语言模型在各种生物技术应用中显示出前景,包括蛋白质设计和工程。在这里,我们描述了 ProGen,这是一种语言模型,可以生成具有跨大型蛋白质家族的可预测功能的蛋白质序列,类似于在不同主题上生成语法和语义正确的自然语言句子。该模型接受了超过19,000 个家族的2.8 亿个蛋白质序列的训练,并增加了指定蛋白质特性的控制标签。ProGen 可以进一步微调到精选的序列和标签,以提高来自具有足够同源样本的家族的蛋白质的可控生成性能。

2023-02-22 16:22:19 1011

翻译 DeePromClass:使用深度神经网络的真核核心启动子的描述符

真核生物中的计算启动子识别是一个经典的生物学问题,应该通过大量实验数据和新兴的深度学习技术的可用性进行翻新。目前的知识表明,真核核心启动子显示出多种多样的信号,如TATA-Box、Inr元件、TCT和Pause-button等,以及G-四链体等结构基序。在本研究中,我们将深度学习的力量与过多的启动子基序相结合,以描绘从 DNA 序列排列的统计特性中收集到的启动子和非启动子。

2023-02-19 09:21:20 566

翻译 Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference

通过提供带有自然语言“任务描述”的预训练语言模型,可以以完全无人监督的方式解决某些 NLP 任务(例如,Radford 等人,2019 年)。虽然这种方法的表现不及监督方法,但我们在这项工作中展示了这两种想法可以结合起来:我们介绍了 PatternExploiting Training (PET),这是一种半监督训练程序,将输入示例重新表述为完形填空式短语,以帮助语言模型理解给定的任务。然后使用这些短语将软标签分配给大量未标记的示例。最后,对生成的训练集执行标准监督训练。

2023-01-05 22:10:28 512

翻译 LncLocator 2.0:具有可解释深度学习的长链非编码RNA的细胞特异性亚细胞定位预测器

长链非编码RNA ( long non-coding RNA,lncRNA )发现于20世纪80年代的( Pachnis et al , 1984),当时被认为是垃圾RNA ( Kung et al . , 2013)。随后的研究表明,这种新的RNA缺乏长而保守的开放阅读框,表明它不是典型的RNA(布兰南等人, 1990年)。后来,更多类似的RNA被发现,它们被归类为lncRNA,它被定义为长度超过200个核苷酸的转录物,而这些转录物不会被翻译成蛋白质。

2022-10-29 20:33:46 1109

翻译 TACOS:一种用于准确预测细胞特异性长的非编码RNA亚细胞定位的新方法

长的非编码RNA(LNCRNA)主要受其细胞定位调节,该细胞定位负责其分子功能,包括细胞周期调节和基因组重排。准确地从序列信息中准确识别LNCRNA的亚细胞位置对于更好地理解其生物学功能和机制至关重要。与传统的实验方法相反,可以将生物信息学或计算方法应用于人类中LNCRNA亚细胞位置的注释。过去,已经开发了几种基于机器学习的方法来识别LNCRNA亚细胞定位,但是鉴定人LNCRNA的细胞特异性定位的相关工作仍然有限。

2022-09-08 17:41:38 1165

翻译 DeepMNE:用于lncRNA疾病关联预测的深度多网络嵌入

长非编码RNA(lncRNA)参与多种生物学过程,因此其突变和疾病在多种人类疾病的发病机制中起着重要作用。识别与疾病相关的lncRNAs对于疾病的诊断、预防和治疗至关重要。尽管已经开发了大量计算方法,但有效整合多组学数据并准确预测潜在的lncRNA疾病相关性仍然是一个挑战,尤其是对于新的lncRNA和新疾病。在这项工作中,我们提出了一种新的深度多网络嵌入方法,称为DeepMNE,以发现潜在的lncRNA-疾病关联,尤其是对于新疾病和lncRNAs。DeepMNE提取多组学数据来描述疾病和lncrna,并提出

2022-06-26 10:51:57 1057

翻译 S2Snet:利用纳米孔进行低分子量RNA鉴定的深度学习

核糖核酸(RNA)是一种重要的核酸,在调节多种生物活性中起着至关重要的作用。最近,一项研究利用机器学习算法自动分类 耻垢分枝杆菌孔a纳米孔陷阱产生的RNA结构。虽然它可以获得理想的分类结果,但与深度学习(deep learning, DL)方法相比,这种经典的机器学习方法需要领域知识手动提取特征,复杂、劳动密集型和耗时。同时,生成的原始RNA结构事件长度不是严格相等的,这与DL模型的输入要求不兼容。为了解决这一问题,我们提出了一个序列到序列(sequence-to-sequence, S2S)模块,该模

2022-04-18 16:30:52 674

翻译 利用一种新的灵活记分卡方法改进肽抗癌活性的预测和表征

期刊:《scientific reports》(nature 子刊)JCR分区:Q1随着抗癌肽(anticcancer peptides,ACPs)在癌症治疗中的广泛应用,人们提出了几种基于机器学习的ACP识别方法。尽管现有方法具有较高的预测精度,但此类模型使用了大量描述符和复杂的集成方法,因此导致低解释性,从而对生物学家和生物化学家构成挑战。因此,有必要开发一种简单、可解释和有效的预测因子,以准确识别ACP,并为合理设计具有临床应用潜力的新抗癌肽提供手段。在此,我们提出了一种新的灵活评分卡方法 #fl

2022-03-10 17:25:36 1289

翻译 Transformer 和卷积神经网络在跨物种基因组DNA N6甲基腺嘌呤位点识别中的应用

期刊名:《METHODS》JCR分区:Q2代码地址:https://github.com/khanhlee/bert-dna文章地址:https://linkinghub.elsevier.com/retrieve/pii/S1046202321002747发表时间:21年12月13号摘要:作为最常见的转录后表观遗传修饰之一,N6-甲基腺嘌呤(6MA)在各种细胞过程和疾病发病机制中发挥着重要作用。因此,准确识别6 mA修饰对于深入理解细胞过程和其他可能的功能机制是必要的。虽然已经提出了一些计算方

2022-01-20 15:18:45 1178

翻译 使用卷积和递归神经网络通过序列和本体表示改进circRNA-疾病关联预测

摘要:新的研究表明,环状RNA(CircRNA)广泛参与人类疾病的进展。由于其特殊的稳定结构,CircRNA是很有前途的疾病诊断和预后生物标志物。然而,circRNA-疾病关联的实验验证成本高昂,且仅限于小规模。有效的计算方法预测潜在的循环RNA-疾病关联被视为当务之急。尽管已经提出了几种模型,但过度依赖已知的关联和缺乏生物功能特征使得精确预测仍然具有挑战性.**结果:**在这项研究中,我们提出了一种基于序列和本体表示的循环RNA-疾病关联预测方法,称为CDASOR,使用卷积和递归神经网络。对于circ

2021-12-05 17:21:03 1451 1

翻译 一种基于子序列的亚细胞定位预测的深度学习框架(DeepLncLoc: a deep learning frame work for long non-coding RNA subcellular)

一种基于子序列的亚细胞定位预测的深度学习框架摘要长链非编码RNA (lncrna)是一类含有200多个核苷酸的RNA分子。越来越多的证据表明,lncrna的亚细胞定位可以为其生物学功能提供有价值的见解。现有的预测lncRNA亚细胞定位的计算方法使用k-mer特征编码lncRNA序列。然而,仅使用k-mer特征会丢失序列顺序信息。R结果:我们提出了一个深度学习框架DeepLncLoc来预测lncRNA亚细胞定位。在DeepLncLoc中,我们引入了一种新的子序列嵌入方法,它保留了lncRNA序列的顺序信息

2021-09-21 11:07:32 1216

翻译 DNA/RNA基序挖掘中的深度学习研究进展(A survey on deep learning in DNA/RNA motif mining)

摘要DNA/RNA基序挖掘是基因功能研究的基础。DNA/RNA基序挖掘在识别DNA或RNA蛋白结合位点方面起着极其重要的作用,有助于理解基因调控和管理的机制。在过去的几十年里,研究人员一直致力于设计高效、准确的挖掘基序算法。这些算法大致可分为两类:枚举法和概率法。近年来,机器学习方法取得了很大的进步,特别是以深度学习为代表的算法取得了良好的性能。现有的深度学习方法在motif挖掘中大致可以分为三类模型:基于卷积神经网络(convolutional neural network, CNN)的模型、基于递归神

2021-09-20 14:50:44 3086

翻译 SNNRice6mA:一种预测水稻基因组DNA n6 -甲基腺嘌呤位点的深度学习方法

DNA N6甲基腺嘌呤(6mA)是一种重要的表观遗传修饰,参与许多生物学调控过程。准确可靠的6mA鉴定方法可以帮助我们更好地了解修饰的调节机制。虽然已经提出了许多实验技术来在全基因组范围内鉴定6mA位点,但这些技术既耗时又费力。最近,已经开发了几种机器学习方法来识别基因组范围内的6mA位点。然而,在预测水稻基因组中6mA位点方面,它们的性能还有改进的余地。在本论文中,我们开发了一个简单而轻量级的深度学习模型来识别水稻基因组中的DNA 6mA位点。我们的模型不需要事先了解6mA或手工制作的序列特征。我们基于两

2021-08-25 09:55:24 640

翻译 Capsule-LPI:基于胶囊网络的LncRNA-蛋白质相互作用预测工具

Capsule‑LPI: a LncRNA–protein interactionpredicting tool based on a capsule networkTOC文章目录@TOC一级目录二级目录三级目录代码和预测网站:http://39.100.104.29:8080/lpc/predict/1.摘要背景:长非编码RNA(lncRNAs)在多种生物过程中发挥着重要作用。识别LncRNA-蛋白质相互作用(LPI)是理解LncRNA功能的关键。虽然已经开发了一些LPIs计算方法,但LP

2021-08-12 16:02:34 2349

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除