上传宏基因组数据到SRA
关于attribute和metadata
看到网上千篇一律的上传教程,还有讨论点解要上传的(-=-?)。为人为己,马克一下这次肛肛上传趟过的坑。web版
https://submit.ncbi.nlm.nih.gov/subs/sra/ 点开就能看到,整个过程大概有以下步骤:
SUBMITTER
GENERAL INFO
PROJECT INFO
BIOSAMPLE TYPE
BIOSAMPLE ATTRIBUTES
SRA METADATA
FILES
REVIEW & SUBMIT
百度可知,各大教程都在教你怎么注册。但其实比较爱卡壳的是填attribute和metadata的表,即使蒙混过关最后还是得回头改这两表。
先说attribute:
下载excel之后真是由衷佩服NCBI,excel都能玩出花儿来。这表头长这样:
*sample_name sample_title bioproject_accession *organism host isolation_source *collection_date *geo_loc_name *lat_lon ref_biomaterial rel_to_oxygen samp_collect_device samp_mat_process samp_size source_material_id description
肛肛打一开始就给出了each identical的sample name,但一直报error。网传在sample name前面加数字就能过关的,或者删掉黄色列的,反正肛肛2020年尝试了就不行。倒是在最后加一列replicate就行了。对,默认的表里没有这一列