数据上传系列已经给大家相继推送了扩增子、转录组、蛋白组学原始数据上传教程,有不少老师在基因组上传过程中也存在着一些疑问,反馈说能否把细菌、病毒、叶绿体和线粒体等小基因组数据上传流程整理发布下,所以这篇小基因组数据上传的推文也就马不停蹄地给大家整理出来啦!话不多说,小基因组数据上传详细步骤给大家奉上!
1 登录NCBI
小基因组数据上传通常会使用到Bankit,使用Bankit前,首先要拥有一个NCBI账户。我们进入Bankit 主页(https://www.ncbi.nlm.nih.gov/WebSub/),点击右上角的Sign in to use Bankit,有NCBI账号就直接使用账号及密码登录,没有就需要注册后再登录(注册步骤见往期推文——数据上传转录组篇)。
点击Start Bankit submission,开始上传吧!
2 联系方式
填写联系信息,检查无误后“Continue”
3 作者和引用
输入序列作者信息和相关文章作者信息(文章unpublished也要拟一个题目哦)。
4 测序及组装信息
选择自己项目的测序平台信息及拼接软件信息:使用高通量测序平台,需提供基因组序列拼接的软件和版本,另外还需填写Coverage(×),计算方法为:mapping到的HQ Data数据量/基因组大小。
5 序列提交
填写数据释放日期、基因组的基础信息(根据自己项目情况进行选择)。关键步骤,粘贴序列or上传fasta文件,只能选一种。
6 物种名称
填写完整的属名和种名,注意物种名称填写规范。
如果提交这一步之后蹦出这样的“Warning”,就要检查一下物种名称是不是正确。如果物种名确实没问题,那就代表NCBI的Taxonomy database中尚未收录该物种名,这时可以在方框中提供包含该物种拉丁名的参考文献或解释该物种为新发现物种。
根据上传序列的研究需求,选择对应的选项。一般基因组项目(核基因组或者质体基因组等)选择Batch选项。
7 提交序列的分类
确认所提交序列是否为首次上传。
8 样品来源
提供样品来源的各项信息、基因组类型(可从下拉选项中选填)。
Source Modifiers可以增加项目样本的基础信息,点击蓝色字体“Source modifier list ”,就可以查看相关参数的含义及示例信息
填好1个指标信息后,点击增加可以填写第2个指标的描述信息,全部填写好后点击“Continue”进入下一步。注意,此步里面添加的指标必须包含本页面首个问题选项中提示的指标。
9 添加注释信息
选择注释信息上传方式,提交tbl文件。如果没有tbl文件,可以使用在线网站gbk(https://chlorobox.mpimp-golm.mpg.de/GenBank2Sequin.html)进行转换。
10 完成提交
确认通信邮箱,点击Finish Submission即完成上传操作。上传完成后邮箱会收到NCBI的的自动回复邮件,2个工作日内就会收到GenBank Accession。