使用Python ete3包快速大批量地寻找物种的NCBI Taxonomy分类的完整信息(物种名和Taxid可进行相互转换)

最新推荐文章于 2024-12-27 23:02:50 发布

你大佬来啦

最新推荐文章于 2024-12-27 23:02:50 发布

阅读量8.4k

点赞数 5

分类专栏：生信新手分享 jie 文章标签： python 经验分享

本文链接：https://blog.csdn.net/keepaware/article/details/108065237

版权

ete全称为Environment for Tree Exploration，直译就是树探索环境，此工具可以直接在终端输入
pip install ete3 进行安装即可。ete包主要功能与构建系统发生树有关，若是有相关需求可以查看其介绍文档，地址：The ETE tutorial。我主要使用到了其中的分类工具，即处理NCBI 的Taxonomy数据库的工具。此工具用于物种信息和分类号的转换十分简便，使用时是根据NCBI的最新分类文件来运作的，因此分类信息十分可靠。

ete3使用NCBI 的Taxonomy数据，因此需要首次使用时需要先下载数据。在应用中主要用到的是ete3包的NCBITaxa模块。首次使用NCBITaxa模块时会检测是否有分类数据存在，没有的话会自动下载。长期未更新时可以直接使用升级选项获取最新的分类数据。即：

from ete3 import NCBITaxa                       # 导入此模块
ncbi = NCBITaxa()
ncbi.update_taxonomy_database()                 # 升级

运行命令后显示如下，此文件taxdump.tar.gz来自于NCBI，网址为：htt

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

你大佬来啦

关注关注

5
点赞
踩
27

收藏

觉得还不错? 一键收藏
8
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python：ete3 用于系统进化树探索的工具包

belldeep的专栏

09-22

825

python ete3 用于系统进化树探索的工具包；参阅：ete3 中文教程

python 进化树_Python / ete3：将最密切相关的叶子定位到系统树中的特定物种

weixin_39765100的博客

03-01

1001

我正在使用Python包ete3。我有以下树木：((Species1_order1,(Species2_order2,Species3_order2)),Species4_order3,Species5_order5);我想看到与树中特定节点(此处为树Species1_order1)关系最密切的叶。在此示例中，最紧密相关的叶子是Species2_order2/Species3_order2和和Sp...

8 条评论您还未登录，请先登录后发表或查看评论

使用ETE包让系统发育树（进化树）和多重序列比对（MSA）“同框”

微生信

10-01

1140

我们可以从不同物种的蛋白质、DNA或者RNA序列的多重序列比对（Multiple sequence alignment，MSA）结果中推断出序列的同源关系，然后以系统发育树（进化树）的方式展示物种进化关系。

Taxonomy 的相关数据下载

dujidan的博客

11-24

418

ftp://ftp.ncbi.nih.gov/pub/taxonomy/ linux怎么提取两个文件相同开头的行？ awk 'NR==FNR{a[$1]=$0}NR>FNR{print a[$1],$2}' test1 test2

从NCBI批量获得关注物种的所有基因组信息，环境分布等

最新发布

luobiubiu的博客

12-27

947

通过NCBI查找关注物种，获得其所有组装基因组来自的生物样品ID（biosample），在bacth entrez网页上传ID list之后，可下载所有相关数据的全部meta data。由此，可以获得关注物种的基因组列表，基因组来自的项目，菌株生存温度，生长条件，样品分离来源，以及其他来源。

NCBI序列名字，批量修改物种名字，修改物种名字

weixin_53662904的博客

06-04

1242

第一版本：修改名字文件，不对序列处理比如序列名字如下，仅仅需要物种名字利用python脚本加正则表达处理；思路：正则匹配 “[” “]”这俩符号，然后为列表，读取列表的-1索引使用：python 脚本.py 名字文件.txt > new_name.txt 结果第二版本待更新（更新实用的正则表达用法，外加序列，彻底解决序列名字问题）作者：luanxins@163.con 欢迎指导！...

OrthoEvolution:一个易于使用且功能全面的python软件包，可帮助分析和可视化直系同源基因。 :monkey_face:

05-04

该软件包着重于利用NCBI blast，各种序列比对策略以及系统发育分析（包括PAML，PhyML，ete3和其他工具）推断直系同源物。最终，该项目的目标是为直系同源物的推理创建可重用的管道，以确保数据的可重复性以及改善...

Python库 | phylofisher-1.0.13-py3-none-any.whl

03-23

总结来说，Phylofisher 1.0.13-py3-none-any.whl是一个功能强大且易于使用的Python库，旨在简化生物信息学家构建和分析系统演化树的过程。其全面的工具箱、灵活的接口和强大的社区支持，使得Phylofisher成为研究物种...

ete3‑3.1.1‑py2.py3‑none‑any.whl

12-21

离线安装包，测试可用。使用 pip install [完整包名] 进行安装

获取物种分类信息的方法（TaxonKit/ete3/Biopython）

Kun_98的博客

12-29

2513

解决数据分析中获取物种分类地位困难的问题。提供通过ncbi号、物种名、taoxid号进行物种分类信息获取的方法。

tcpdump.tar.gz

06-20

tcpdump - dump traffic on a network. the tcpdump directory contains "libpcap-1.1.1 Makefile tcpdump-4.1.1". you just need execute make.

python3 collections模块 tree_python3上的ete3模块无法导入TreeStyle、faces、AttrFace、NodeSty...

weixin_39640762的博客

12-22

1021

我是一个linux用户，到目前为止，我已经在python2中成功地使用了ete3。在我为python3安装了ete3，有些模块python3找不到。我相信我已经按照说明安装了所有的依赖项。在我可以从ete3导入ete3和Tree，但不能导入到目前为止使用的任何其他工具。在有什么线索可以解决这个问题吗？在~$ python3Python 3.4.3 (default, Nov 28 2017, 16...

python 进化树_Python ete3有没有一种方法来扩展系统进化树的分支？

weixin_31159999的博客

02-03

377

过了很长时间，我找到了一个解决办法：据我所知，在PhylogenticPython库中没有内置函数来扩展树。这很奇怪，我希望我错了。在然而，一旦你了解了它们的数据结构，就有了一种简单的方法：你只需要遍历树的所有边，然后将它们乘以所需的因子。这是不同的，这取决于您使用的库。以下是两个示例，如何使用dendropy和ete3拉伸两倍大小的树：from ete3 import Treeimport de...

进化树软件ete3报错记录

weixin_43364556的博客

02-01

826

背景：进化树分析和展示程序ete3的python的API在命令行调用的时候报错。报错内容但是在linux的图形界面下运行就是没有问题的。在命令行下运行就报错。结果就是不输出png,pdf等需要输出的进化树作图文件。解决办法在~/.bashrc下添加环境变量参数： export QT_QPA_PLATFORM="offscreen" 个人理解图形界面不报错，命令行界面报错表示和图形界面的输出相关，提示里提到了 Could not connect to display Could not co.

NCBI生物分类数据库（Taxonomy）

热门推荐

Baimoc

07-10

3万+

文章目录介绍查询某个物种的全部核酸序列和蛋白序列查看某个物种的其他信息（蛋白结构，基因，测序数据，相关文献等）Taxonomy 的相关数据下载**gi_taxid 标识的数据****taxcat 标识的数据**以尼安德特人（taxid：63221）为例介绍 Taxonomy : NCBI公共序列数据库中所有生物的策划分类和命名法。目前包含地球上大概10%的物种。我们现在查询到底包含有有多少物种...

[爬虫实战]利用python根据样本ID快速收集对应样本的相关信息

weixin_56070595的博客

11-05

574

最近，老师给翔哥安派了个活，按老师的要求是需要，由于需要收集的样本数量较多，手动收集的效率比较低下，奈何自己对爬虫又不是很熟，于是就找到了我，让我帮忙给他写个python爬虫来完成这个任务，下面记录整个解决过程，仅供参考。

NCBI数据库以及常用编号

songyi10的博客

10-06

7985

NCBI数据库在微生物测序分析中，常常需要对未知的核酸或蛋白序列进行物种,功能或类别注释。注释方法种类较多，其中最常用的是与一些标准数据库进行相似性搜索，也就是序列比对。因此，数据库的优劣对注释结果至关重要。 NR/NT数据库 NR(Non-Redundant Protein Sequence Database)非冗余蛋白库，所有GenBank+EMBL+DDBJ+PDB中的非冗余蛋白序列，对于所有已知的或可能的编码序列，NR记录中都给出了相应的氨基酸序列（通过已知或可能的读码框推断而来）以及专门蛋白数据

查询宇宙生命的家谱--TaxonKit工具详解

Neptuneyut的博客

06-18

4859

文章目录遇到的问题taxonkit 概述taxonkit安装安装下载依赖数据taonkit使用1）列出给定taxonomy id的子分类树2）从taxid获取完整谱系3）重新构造谱系的格式4）通过物种拉丁名查询taxid：name2taxid回到问题一个也不能少参考作者：余涛 email：yutao@big.ac.cn 中国科学院大学遇到的问题在做宏基因组分析时，通过基因注释得到一个包含10...

TaxonKit工具：获取物种NCBI数据库的Taxonomy ID

rainforestist的博客

10-19

4185

网址： https://bioinf.shenwei.me/taxonkit/ TaxonKit工具，采用命令行模式，可以便于使用loop循环进行流水作业。 ###想要实现的功能：输入一个科名列表文件，批量查询其taxonomy ID； | 子命令 | 功能 | [list]——列出指定TaxId下所有子单元的的TaxID [lineage] ——根据TaxID获取完整谱系（lineage） [reformat]——将完整谱系转化为“界门纲目科属种株"的自定义格式 | [name2taxid]——将分类单元

使用Python ete3包快速大批量地寻找物种的NCBI Taxonomy分类的完整信息(物种名和Taxid可进行相互转换)

目录

下载升级数据库