向NCBI提交数据是非常麻烦的事,它的要求非常高,而且还坚持一些不是标准的标准,下面是记录自己提交数据是的步骤,以备后用。
一、submit reads
1、prepare .fq data
准备.fa格式的数据,这个其实平常用的就是,不是的话估计还是比较麻烦的。其格式如下:
@FC61K87AAXX:6:1:1035:17969#0/2
NNNNNNACAGCACAGNNNNNNNGNNNNNNAACAGGTGNNNNNAA
+
BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB
@FC61K87AAXX:6:1:1035:2669#0/2
NNNNNNCAAATTCCANNNNNNNGNNNNNNNAACGTGANNNNNGN
+
BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB
2、NCBI网页注册和准备
进入主页(http://www.ncbi.nlm.nih.gov/guide/)
1) Submissions:
2) Sequence Read Archive (SRA)
4) NCBI Primary Data Archive Submitters
5)sign in
Username:bgi
Password:*******
在这儿最好不记住密码,有时候合作方会先注册,你再提交后有时会出不来。
6)create new submission
7)后面的就要自己创建任务。
注意:在申请的过程可能还需要申请Project ID。这首先要确认自己的项目是否已经注册过了,一个项目一个ID,申请多了的话不能自己注销,和NCBI的人员交流需要很长时间,而且只能用邮件。本身提交数据就是一个拉锯战。
3、上传数据。
到此为止,准备就做完了,之后就要上传数据了。自己上传不了,需要用ftp上传,在华大就是向3811发任务。
这儿有具体的发任务格式,按要求进行。
猪蛔虫实例:
http://trace.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi?subid=69656&from=list&action=show:submission
未完待续,assembly data