GEO数据上传教程 SuperSeries

猛码先生

已于 2024-01-05 12:26:57 修改

阅读量1.2k

点赞数 19

文章标签：笔记

于 2024-01-05 12:26:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46336667/article/details/135402650

版权

需要注册一个NCBI（https://www.ncbi.nlm.nih.gov/）账号

用NCBI账号登入GEO，点击提交数据页面 Submitting data - GEO - NCBI

比如我要上传两个测序数据，分别是WGBS以及RNA-seq，

点击“Submit high-throughput sequencing”

弹出Submit high-throughput sequencing data to GEO页面

要求提交三种类型文件，

1. a metadata spreadsheet

2. processed data files

3. raw data files

metadata spreadsheet模板可以在下方下载，一个组学数据填写一个，我有两个组学数据，所以要填写RNA-seq以及WGBS，对应两个xlsx

processed data就是处理文件

比如RNA-seq为自己分析流程处理得到的rawcount.txt

比如WGBS为自己分析流程处理得到的sample.tab

raw data就是测序文件 sample1_R1.fastq.gz sample1_R2.fastq.gz

准备好上述文件后，就可以开始上传了，下方用过FTP上传，点击Transfer files

可以看到个人的上传空间目录为uploads/xxxxxxxx

点击step2 Transfer files 会显示

可以采用FileZilla上传，这里有个bug，一直没有连上，显示error

debug后，发现要在右边输入uploads/xxxxxxxx，才能进入目录

因为有两个组学数据，我分别建了两个文件夹，WGBS和RNA-seq，

把WGBS的原始数据fastq.gz，以及WGBSprocess数据上传到WGBS文件夹

把RNA-seq的原始数据fastq.gz，以及RNA-seqprocess数据上传到RNA-seq文件夹

当然，最后我没有用FileZilla，因为数据太大，FileZilla只有400-500kb/s,太慢了

Example Linux/Unix sessions里，提供了很多其他上传方法，我最后采用的是sftp，大概有3M/s，也算是可以接受

上传完毕后，点击upload metadata，把metadata上传，

因为我上传的是super series，按照要求

我提交了两次，日期都选在一年后公布，

首先选择WGBS文件夹，提交了WGBS的metadata数据，提交的时候在comment要求定义为一个super系列，并提供了大标题名

然后选择RNA-seq文件夹，提交了RNA-seq的metadata数据，提交的时候在comment要求定义为一个super系列，也提供了大标题名，

最后，

WGBSmetadata里的标题就是xxxxxxxxxx search[WGBS]

RNA-seqmetadata里的标题就是xxxxxxxxxx search[RNA-seq]

大标题就是xxxxxxxxxx search

最后会显示提交成功，然后大概5个工作日之内可以去查看

就可以查询到了super GEO 以及两个 sub GEO

关注

19
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。