DeepBGC:生物合成基因簇的检测和分类

DeepBGC使用深度学习来检测细菌和真菌基因组中的BGC。DeepBGC使用双向长期短期记忆递归神经网络和Pfam蛋白域的word2vec样载体嵌入。使用随机森林分类器预测产品类别和检测到的BGC的活性。
简单来说就是他可以挖掘到antismash没有分析出来的BGC
在这里插入图片描述

deepbgc安装:https://github.com/Merck/deepbgc

运行deepbgc

#Show command help docs

deepbgc pipeline --help

#Detect and classify BGCs in mySequence.fa using DeepBGC detector.

deepbgc pipeline mySequence.fa

#Detect and classify BGCs in mySequence.fa using custom DeepBGC detector trained on your own data.

deepbgc pipeline --detector path/to/myDetector.pkl mySequence.fa

json输出文件在antismash中可视化在这里插入图片描述

json文件可视化只在antismash6.0版本以上才有,本地化antismash 6.0版本还未发布

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
生物信息学是一门研究如何利用计算机和统计学等工具来解析生物学数据的学科。序列和基因组分析是生物信息学中的重要研究方向之一。 序列分析是指对生物分子序列(如DNA、RNA和蛋白质序列)进行研究和分析的过程。通过序列比对、序列拼接和序列注释等方法,可以揭示出序列的结构、功能和演化关系。序列分析广泛应用于基因组学、生物多样性、蛋白质结构预测和新药研发等领域。 基因组分析则是对整个基因组的进行研究和解析。基因组是个体的遗传信息的完整集合,包括DNA序列、基因组结构和功能元件等。基因组分析的目标是识别基因、预测基因的功能、研究基因组结构和演化、揭示基因与表型之间的关联等。基因组分析为研究生物体的基因组组成、功能和调控提供了重要的工具和方法。 PDF格式是一种常用的电子文档格式,生物信息学领域也有大量的相关资料以PDF格式发布。《生物信息学:序列和基因组分析》PDF是一本介绍生物信息学中序列和基因组分析原理和方法的书籍。该书系统地介绍了序列比对、序列拼接、序列注释、基因预测、基因组结构和演化等内容,帮助读者理解和应用生物信息学在序列和基因组分析方面的重要技术。 总之,生物信息学中的序列和基因组分析是研究生物分子序列和整个基因组的结构、功能和演化的重要领域。《生物信息学:序列和基因组分析》PDF是一本介绍该领域原理和方法的书籍,对于学习和应用生物信息学的研究者和学生具有重要意义。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值