一、为什么需要生物数据库
上期在介绍GenBank格式时举了新冠病毒基因组的例子,仅一个S基因就长达3822
nt(nucleotide,这里指核苷酸数),基因组全长接近3万个碱基。
LOCUS NC_045512 29903 bp ss-RNA linear VRL 18-JUL-2020
...
gene 21563..25384
/gene="S"
/locus_tag="GU280_gp02"
/gene_synonym="spike glycoprotein"
/db_xref