参考基因组数据库原始数据经过参数的修改去除,可以达到我们想要的结果。现在需要将我们自己的测序数据fastq格式,与数据库中基因组文件(通常为fasta格式)和注释文件(通常为gtf/gff格式)进行比对
常用的数据库有Ensembl数据库,NCBI数据库,和UCSC数据库,同一个物种在这些数据库中的命名可能不太一样 。在这里使用的是Ensembl数据库,国内打开这个数据库直接就是亚洲版本的了。
进入官网Ensembl数据库:https://http://asia.ensembl.org/index.html
点击Human,下载人类基因组文件和注释信息