随着二代测序的成本不断降低,植物叶绿体基因组与动物线粒体基因组的公布越来越广泛,也伴随着NCBI数据库等的数据审核更加严格。论文投稿返修难度也在不断增加,其实这种问题很大一部分是因为注释问题而导致。在本处将以植物叶绿体基因组为例,来介绍一种难度较低且准确程度较高的质体基因组注释方法。
大致流程:初步注释(植物叶绿体基因组在geseq网站中,动物线粒体基因组在mitos2中)→获得初步注释的gb文件(geseq可以直接获得,mitos需要用tbl或gff跟fa一起进行文件格式转变)→gb文件初步修正→转为sqn格式→在sequin软件中修正→导出为gb文件。在本文中,介绍gb文件初步修正及之前的步骤,在注释中切记gb文件初步修正十分重要。
一、geseq注释植物叶绿体基因组(初步注释)
页面往下滑
再往下滑还有一个trnascan-se,这个最好选上,对于trna注释的准确性非常重要
二、获得初步注释的gb文件
运行完成下载genbank文件
三、gb文件初步修正