GEO数据库中单细胞测序数据下载

本文介绍了如何从GEO数据库下载单细胞测序数据。通过GSE号查找相关研究,确认数据平台,然后依次下载GSM样本的fastq或bam文件。对于只有bam文件的情况,可使用10x Genomics的工具进行转换。
摘要由CSDN通过智能技术生成
  • 首先GEO数据库是收集基因表达的数据库

        一般高通量测序文章发表时会将原始数据上传至GEO数据库并在文章中提供GSE 号,如果想对某些文章的数据进行在分析,可以在GEO数据库搜索文章中的GSE号。

        用户提供的原始数据有3种:Platform,Sample和Series。GEO数据库整理后的数据分为:数据集(datasets)和表达谱(profiles)。GEO数据库具体存放四类数据:GDS、GSE、GSM、和GPL。GDS号(GDSxxx)对应的一个同一平台的数据集, 包括微阵列和高通量测序产生的数据;GSE号(GSExxx)对应的是整个研究项目的系列的数据,可能涉及不同平台;GSM号(GSMxxx)是具体某个单一样品的数据信息,只能是单一平台的数据;GPL号(GPLxxx)对应平台的信息,例如Illumina测序平台型号、芯片型号等。

       一篇文章可以有一个或多个GSE数据集,一个GSE里可以有一个或多个GSM样本。多个研究的GSM样本可以根据研究目的整合为一个GDS,每个数据集有着自己对应的芯片平台(GPL),一个GSE里可能有多个平台测出的数据。

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值