逐行读取文本
open FH,"1.txt";
while(<FH>) #逐行读取文本
{
print $_;
}
1、输入物种名 拿到tax id
https://www.ncbi.nlm.nih.gov/Taxonomy/TaxIdentifier/tax_identifier.cgi
例如西瓜:
2、NCBI下载gene2go.gz
ftp://ftp.ncbi.nih.gov/gene/DATA/
3、下载
关于这个taxid的资料还有很多
链接: ftp://ftp.ncbi.nlm.nih.gov/pub/taxonomy/.
其中我们可以下载
wget ftp://ftp.ncbi.nih.gov/pub/taxonomy/taxdump.tar.gz
这个文件,解压可以看到里面有以下文件,其中比较重要的两个文件
nodes.dmp 这个文件列出了taxid的树的结构信息,子节点,父节点等等
names.dmp 这个文件里面列出了每个独特的taxid对应着的物种名