菜鸟自学02:下载参考基因组及构建bowtie2索引
1.下载参考基因组
根据文章里的“Data deposition: The sequence reported in this paper has been deposited in the GenBank database (accession no. AE005673).”,可进入genebank下载数据。
下载选择:1)如果想直接下到服务器里,一般选择send to-files-summary,然后会下载得到一个文件,里面有download的地址,再在服务器里wget就行了,但是我试了一下,文件里只有三行基本的数据描述信息。
2)选择fasta格式先下载到本地,再上传服务器。注:ncbi的ftp服务器一般是用于下载GEO的数据。
3)可选择不同的数据库。常用参考基因组下载地址
Ensembl数据库是由欧洲分子生物学实验室下属的生物信息研究所以及sanger公司共同开发,提供真核生物基因序列及其注释信息并对之进行管理的数据库。除此以外,Ensembl还能进行基因信息整合、数据分析以及生物信息学处理等功能,被广泛应用。Ensembl与NCBI的NCBI Map Viewer和UCSC是最为常用基因组检索数据库。
mkdir -p ~/project/hic/ref
cd ~/