GEO数据下载及处理详细过程

本文详细介绍了如何从GEO下载RNA-seq数据,并进行处理。通过GEO2R进行数据分析,转换SRA文件为fastq,但在数据中找不到样品信息。需要通过GEO搜索SRR编号获取GSM信息,了解样品细节。GEO DataSets的GDS、GSE、GPL和GSM编号分别代表数据集、系列、平台和样品登陆号。
摘要由CSDN通过智能技术生成

GEO2R

       如果出现提示,请指定GEO系列加入和平台。
       单击“定义组”并输入您计划比较的样品组的名称,例如测试和控制。
       将样本分配给每个组。 突出显示Sample行,然后单击组名称以将这些Samples分配给该组。 使用样本元数据(标题,源和特征)列可帮助确定哪些样本属于哪个组。
       单击“前250”以使用默认设置执行计算。
       结果表示为按显着性排序的基因表。 提出了前250个基因,可以将其视为轮廓图。 或者,可以保存完整的结果表。
        您可以更改选项选项卡中的设置。

参考文献:

  • Smyth, G. K. (2005). Limma: linear models for microarray data. In: Bioinformatics and Computational Biology Solutions using R and Bioconductor, R. Gentleman, V. Carey, S. Dudoit, R. Irizarry, W. Huber (eds.), Springer, New York, pages 397-420.
  • Sean Davis and Paul S. Meltzer (2007). GEOquery: a bridge between the Gene Expression Omnibus (GEO) and BioConductor. Bioinformatics 23(14): 1846-1847..]

 

######很多时候我们需要从GEO(https://www.ncbi.nlm.nih.gov/geo/)下载RNA-seq数据,一个典型的下载页面是https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE76381(搜 GSE76381)。

这里你会看到数据的总览:

GSM2268339    1772067089_A01
GSM2268340    1772067089_A02
GSM2268341    1772067089_A03
……
复制代码<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值