写在前面
- 当完成一个基因组项目最后的步骤是在公共数据库释放数据,公共数据库用的最多的就是NCBI,EBI或者DDBJ这三大数据库,其中DDBJ我只下载过一次数据,感觉也就日本人自己会上传数据;EBI里会提供sra文件和fastq文件,不想自己拆分且文件不大的话可以直接下载;最流行的还是NCBI上的各种数据。当然其他各种分门别类的数据库也有很多的,只要能够数据公开,被杂志承认就是可以用的。这里是总结一些数据上传经验和体会,不做具体流程说明,相关流程有大把的资源。
吐槽NCBI
- 体验过NCBI的基因组数据上传,原始数据上传还好,先注册账号,按table格式填写样品信息(物种名,分类,来源,测序方法,数据类型等),生成BioProject ID和BioSample ID,这两个ID是用来发表文章的,文件比较小可以使用网页方式上传,操作简单,数据实在大可以使