geodatabase怎么连接MySQL_实用帖-手把手教你如何上传GEO数据库

6b6c3d435475614de3075eaa0bdf827d.png

点击进去如下图:

可以看见我们上传数据需要准备三个文件,分别为:Metadata spreadsheet、Processed data files、Raw data files。下面分别介绍每个文件如何填写以及准备。

01、Metadata spreadsheet文件

点击下方链接下载该表格

353e44df178f226e84ed8b5b87885e0c.png

该表格一共包括7个部分,以下将分别介绍如何填写:

A、SERIES

主要包含文章的标题、概述、实验整体设计、共同作者、补充材料和SAR号(SRA号为选填,如果已经上传了SRA,则填上,否则空着即可)

939fd36a1a3944a03d5b3cc56cc6182b.png

B、SAMPLE

样品的详细信息,包括样品名称、来源、器官、年龄、表达值数据和原始数据等

db8c926624c29fb6689fb35b59e718d9.png

C、PROTOCOLS

样品的实验和提取建库详情

afd5a4383f72311c6d82bb3400da52dd.png

D、DATA PROCESSING PIPELINE

高通量数据的处理过程,主要包括碱基识别、比对、过滤、参考基因组、文件格式等

1e4083b8caecdd60d510289ad02bc741.png

E、PROCESSED DATA FILES

基因表达量文件名称、文件类型和MD5值(windows电脑可以使用MD5码生成软件,linux可以用md5sum file命令生成)

de087cde93f32daef789336f0594a86a.png

F、RAW FILES

原始数据文件名称、格式、MD5码、平台类型、测序读长和单双端信息

a8d6c8869ae9cb43a7ec034e2972dc70.png

G、PAIRED-ENDWEXPPERIMENTS

如果是双末端数据,需要填写原始数据名称、插入片段长度、标准偏差

3ca182ef8243444051bbe17aec6c18cd.png

02、Processed data files文件

基因表达量文件 ,如果没有预测的新基因,文件只需要提供gene ID 和表达量如下:

823d100ae5beca56857473db4a668fc7.png

如果表达量文件包含新预测的基因,还需要补充新基因(已知基因可选填)的Chromosome(染色体号)、Strand(正负链信息)、start(起始位置)、end(终止位置)、length(长度)。

c406b1efdc15bd61d20dae85f92325f5.png

03、Raw data files文件

这里需要准备clean 数据的fq文件,通常情况下fq文件很大,因此GEO数据库要求fq文件必须压缩。

到这里准备工作就全部做完了,下面开始上传数据

92fd23b75859a62f31236a1d8ea8b97c.png

上传数据有以上两种途径,小编比较推荐第一种,利用FileZilla软件,下载地址点击图片的链接,打开FileZilla软件,开始上传数据,主机(H) 框填写上图中host对应的内容ftp-private.ncbi.nlm.nih.gov,用户名(U)填写geo,密码填写 33%9uyj_fCh?M16H,端口号可不填,全部填好后,点击快速连接按钮。

61d36d17f355d4ff0576886697289768.png

连接成功后,在远程站点下的文件名展示中创建自己的文件,最好在fasp目录下面创建自己的目录(当然也可以与fasp目录同级下创建),例如ABC,创建方法为点击鼠标右键,会出现下图中的创建空文件夹对话框,输入自己文件夹的命名,之后点击确认,这样你的文件夹就创建成功了。

a3bdcadaf9972bd3f3f1c05a70a8ebc0.png

最后在本地站点中找到您要上传的文件,双击就可以将文件上传到您在GEO创建的路径下了,数据上传一般会比较慢。数据全部上传后,需要给GEO发邮件,点击下方的链接。

b3da9d32e0b7e4ffb4ffdba5360ab577.png

邮件内容可以参考下方:

邮件主题:Submitting high-throughput sequence data to GEO

邮件正文:

Dear sir,

We had finished the raw data uploading .Please check according to the following information :GEO account username: GEO帐号Names of the directory and files deposited: ABC(存放数据的路径)Public release date :数据释放日期Our raw files were named as follows: XXX.fq.gzOur Processed data files were named as follows: XXX.txtand Metadata spreadsheet were named as follows: Metadata_spreadsheet.xls

Thank you again for your time!

一般GEO第二天就会给您回复邮件,告知您具体的GEO号。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值