今天是生信星球陪你的第481天
大神一句话,菜鸟跑半年。我不是大神,但我可以缩短你走弯路的半年~
就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~
这里有豆豆和花花的学习历程,从新手到进阶,生信路上有你有我!
豆豆写于19.11.5
这次的推送要感谢小郭(帮我看到了一个非常容易忽视的错误)和花花(帮我处理了一个简单但有用的脚本)
又让我有了新的发现
问题是这样滴
我的需求
我想下载SRA 数据,然后需要构建一个配置文件(也就是一列是SRA ID),一列是样本名称。这样做的目的是为了后面使用fastq-dump
进行SRA转fq文件的结果更易懂
# 比如原来的一个sra是SRR391032.sra。如果只使用默认的fastq-dump参数,结果就是
SRR391032.1.fastq.gz
SRR391032.2.fastq.gz
# 但这样的数据多了,我们就分不清哪个数据对应哪个样本,于是需要在转换过程中就将样本名对应到fq文件上
# 例如构建这样一个config,第一列是SRR ID,第二列是sample
# config文件就长这样(举个例子)
SRR391032 WT-1
SRR391033 WT-2
SRR391034 TRT-1
SRR391035 TRT-2
现在找到GEO:https://www.ncbi.nlm.nih.gov//geo/query/acc.cgi?acc=GSE102339