NCBI marker基因测序数据提交
提交时候铭记NCBI数据提交包括三个要素:SRA序列数据、sample、project;project可以包含n个sample,sample可以同时含有n种不同基因的序列数据。
-
提交序列时,可以先建立sample数据(https://submit.ncbi.nlm.nih.gov/subs/bioproject/)
-
此后创建Project (https://submit.ncbi.nlm.nih.gov/subs/bioproject/)
依次填写相关内容,这里提交一个表格或者而网上直接填写,这个表格就是把project含有的sample和SRA序列数据构建起联系,这里的SRA序列是序列文件名称。(或许也可以先上传SRA数据,再通过构建project把SRA和sample联系起来,但我没试过这操作) -
上传SRA序列数据
这里需要注意的是SRA文件名必须和project提交表格中的完全一样,要不然会报错。当你的数据不大(<1G)时,可以通过Aspera browser plugin upload,一般1G数据2分钟既可完成。如果数据量比较大,Aspera command line upload(此时,需要一个key file,需要在网页下点击获得)
ascp -i ./aspera.openssh -QT -l100m -k1 -d D:\xiazia\Release682\MJ20220725202-全长微生物多样性分析-44个样本\rawData subasp@upload.ncbi.nlm.nih.gov:uploads/email_o3fSPTka
- 然后就可以获得project number,在论文data availability中提及即可。Applied Environmental and Microbiology在审稿阶段就需要看到你的提交信息,可以给他们一个review link既可。