chevkv基于成对ANI的快速基因组聚类

最新推荐文章于 2024-09-14 18:46:05 发布

筱贺学生信

最新推荐文章于 2024-09-14 18:46:05 发布

阅读量355

点赞数 3

分类专栏：生信文章标签： java 开发语言

本文链接：https://blog.csdn.net/m0_70166478/article/details/126950783

版权

生信专栏收录该内容

17 篇文章 0 订阅

订阅专栏

1、首先，创建一个blast+数据库

makeblastdb -in <my_seqs.fna> -dbtype nucl -out <my_db>

2、接下来，使用来自blast+包的巨型爆破执行序列的全队全部爆破

blastn -query <my_seqs.fna> -db <my_db> -outfmt '6 std qlen slen' -max_target_seqs 10000 -o <my_blast.tsv> -num_threads 32

3、注意：使用-perc_identity标志将以牺牲灵敏度为代价加快搜素速度

blastn -query <my_seqs.fna> -db <my_db> -outfmt '6 std qlen slen' -max_target_seqs 10000 -perc_identity 90 -o <my_blast.tsv> -num_threads 32

4、接下来，通过组合序列对之间的局部比对来计算成对的ANI

anicalc.py -i <my_blast.tsv> -o <my_ani.tsv>

5、最后，使用MIUVIG推荐参数（95%ANI + 85%自动对焦）执行类似UCLUST的聚类分析

aniclust.py --fna <my_seqs.fna> --ani <my_ani.tsv> --out <my_clusters.tsv> --min_ani 95 --min_tcov 85 --min_qcov 0

详细点这

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

筱贺学生信

关注关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

聚类分析

G090909的博客

11-16

3185

##了解基础知识聚类分析与判别分析都是研究分类问题，但两者有本质的区别。聚类分析一般是寻求客观分析的方法，事先对总体的几种类型无从知道，而判别分析则是在总体类型划分已知，各总体分布或来自各个总体训练样本的基础上，对当前的新样本用统计分析的方法判定它们属于哪个总体。1.聚类分析基本思想系统聚类法是将n个样品分成若干类的方法，其基本思想是：先将n个样品各自看成一类，然后根据类与类之间的距离，选择距离最小

MPB：微生物所东秀珠组-基于16S rRNA基因和基因组序列对细菌物种的初步鉴定...

刘永鑫的博客——宏基因组公众号

03-02

1万+

为进一步提高《微生物组实验手册》稿件质量，本项目新增大众评审环节。文章在通过同行评审后，采用公众号推送方式分享全文，任何人均可在线提交修改意见。公众号格式显示略有问题，建议电脑端点击文末阅...

参与评论您还未登录，请先登录后发表或查看评论

如何在blast输出结果中添加物种名称

weixin_34242819的博客

11-17

4914

最近做一个项目需要利用blastn结果来画出进化树，这样就需要有物种名称。一种方法是利用blastn输出的gi去NCBI查询获取到物种名称，虽然也是可行的，但是有没有简单一点的方法呢？笔者经过各种Google终于找到了一种方法。 1. 所需要的基础知识首先有几个基础知识是需要掌握的：第一，用于构建blast数据库的fasta序列文件里...

这可能是最全最好的BLAST教程

xuzhougeng blog

09-02

6755

Basic local alignment search tool (BLAST) 包括：blastn, blastp, blastx, tblastn, tblastx等. 使用conda安装即可。 conda install -c bioconda blast # blast安装perl模块的方法 conda install perl-digest-md5 B...

ANI-平均核苷酸一致性

songyi10的博客

07-01

1万+

ANI-平均核苷酸一致性 ANI DDH(DNA-DNA hybridization)DNA分子杂交-曾经作为基因组水平上的原核物种界定的黄金标准已经被使用了将近50年。它作为唯一的提供数字化和相对稳定物种界定的分类学方法，它对现在的分类方法有着重要的影响地位。但是，现在的基因组学时代，DDH显得有点过时了。两个基因组间ANI(average nucleotide identity)由于最能反映DDH，是一种不错的分类的方法。物种的概念大概由2,400年前的 Aristotle（亚里士多德）提出来的

FastANI:快速全基因组相似度（ANI）估计

05-12

ANI被定义为两个微生物基因组之间共有的直系同源基因对的平均核苷酸同一性。 FastANI支持完整和草图基因组装配的成对比较。它的基本过程遵循与所述类似的工作流程。但是，它避免了昂贵的序列比对，并使用作为其...

ani-rss:使用 hummingbird.me 公共 api 和 rss 阅读器的 Android 客户端应用程序使用聚类算法对传入的新闻进行排序

06-13

ani-rss 是一个基于 Android 的客户端应用程序，专为动漫爱好者设计，它利用 hummingbird.me 提供的公共 API 来获取动漫相关的资讯，并结合 RSS 阅读器功能，为用户提供个性化的新闻体验。该应用的独特之处在于其...

dRep-基因组质控、去冗余及物种界定

Neptuneyut的博客

11-10

2011

文章目录概述使用结果参考概述在许多情况下，确定微生物之间的关系是研究问题的中心。居住在建筑物表面的微生物是否与居住在其租户中的微生物相同？医院病房中的微生物是否与新生婴儿中的微生物相同？生活再木制表面的大肠杆菌与生活在塑料的大肠杆菌一样吗？常常通过平均核酸相似性（Average Nucleotide Identity, ANI)来衡量。基本思想是比对两个基因组并计算比对中错配的数量。例如，ANI为99％的基因组每100个碱基之间有1个错配，而ANI为95％的基因组每100个碱基之间有5个错配，

细菌完成图+比较基因组分析添好文

muhamuha2020的博客

12-20

1691

近日，派森诺生物与上海交通大学农业与生物学院合作，在微生物基因组领域《Frontiers in Microbiology》发表研究成果！本文首次报道一种新型假单胞菌1257菌株，该菌株可以有效抑制水稻黄单胞菌（xanthomonasoryzae，Xoc）在水稻中的生长和迁移，从而预防细菌性叶斑病(bacterial leaf streak，BLS)。研究背景假单胞菌是普遍存在于土壤、水、动物和植物根际的革兰氏阴性菌，其具有生长速度快并在植物根际持续存在的能力，能够产生广泛的次生代谢产物(如抗生素、铁载体

clusting_聚类_clusting_源码

10-03

"clustering_聚类_clustering_源码"这个标题暗示我们将探讨一种聚类算法的实现，特别是与快速k-means算法相关的代码。 k-means是最常见的聚类算法之一，其工作原理是通过迭代将数据点分配到最近的聚类中心。该算法...

数据挖掘——学习笔记（聚类算法分类）

dews27368的博客

04-09

226

聚类分析计算方法主要有如下几种： 1. 划分法(partitioning methods) 　　给定一个有N个元组或者纪录的数据集，分裂法将构造K个分组，每一个分组就代表一个聚类，K<N。而且这K个分组满足下列条件：（1）每一个分组至少包含一个数据纪录；（2）每一个数据纪录属于且仅属于一个分组（注意：这个要求在某些模糊聚类算法中可以放宽）；对于给定的K，算法首先给出一个初始的...

这或许是我写的最全的BLAST教程

热门推荐

xuzhougeng blog

09-07

1万+

Basic local alignment search tool (BLAST) 包括：blastn, blastp, blastx, tblastn, tblastx等. 使用conda安装即可。 conda install -c bioconda blast # blast安装perl模块的方法 conda isntall perl-digest-md5 BLAST的主要理念 ...

2022.03.24【基因组组装】|获取比对到参考基因组的contig序列

03-24

4542

文章目录摘要工具与方法操作方法step.1 构建参考基因组数据库step.2 比对序列step.3 获取query_idstep.4 获取比对序列结果展示摘要很久没有整理工作笔记了，一方面个人有些倦怠，另一方面国内国际发生的事都牵动着许多人，我也不例外。趁着今天项目不多，记录一下最近的解决方案。上周遇到一个想检测测序样品中是否包含预期的细菌物种。使用nr数据库比对以及metaphlan3进行物种注释都找到了客户的预期物种。然后客户希望通过测序数据组装出一套基因组。要求是组装出来的contig必须是都比

【Bash】用本地 NCBI Blast 寻找FASTA的物种分类

骑著代码，看世界百态

11-20

1677

update_blastdb.pl --decompress nt ./ncbi-blast-2.10.1+/bin/blastdbcmd -entry all -db nt -out nt.fsa cd //BLAST+/ prog=//BLAST+/ncbi-blast-2.10.1+/bin #BLAST+ (blastn, v2.10.1) for fasta in ./tobe_blast_dir/*; do BNAME=$(basename $fasta); QUERY=${BN

BLAST+中blastn参数详解

dowhathowtodo

05-22

1万+

【转】BLAST+中blastn参数详解 2012-05-22 13:25 转载自lidaof 最终编辑lidaof 与之前的blast相比，新的blast+将blastn,blastx等合作与blastall命令分隔开来，对各个命令的参数定制更加方便个人在使用blastn的过程中总结了一些自认为常用的参数，总结如下： blastn -db database_name -query in...

本地blast详解

amw5181360的博客

11-21

2233

BLASTALL 用法 a.格式化序列数据库格式化序列数据库— —formatdb formatdb简单介绍: formatdb处理的都是格式为 ASN.1和 FASTA，而且不论是核苷酸序列数据库，还是蛋白质序列数据库；不论是使用Blastall ，还是Blastpgp，Mega Blast应用程序，这一步都是不可少的。 formatdb命令行参数: ...

Blastdb

光尘的博客

04-25

3128

安装在ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/中下载最新的BLAST可执行程序 wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.9.0+-x64-linux.tar.gz mv ncbi-blast-2.9....

drep：微生物基因组快速去冗余-文章解读+帮助文档+实战

刘永鑫的博客——宏基因组公众号

09-12

9688

在微生物分离培养、分箱中获得的大量的基因组、宏基因组拼接的基因组(MAG)，如何确定到底有多少种非冗余的细菌基因组呢?来自加州大学伯克利分校Jillian F Banfield组开发的d...

Java-网络