如何根据SRA accession number 从NCBI下载数据

根据 accession number从NCBI下载FASTQ/FASTA格式的测序数据(pig)

1. 打开NCBI(https://www.ncbi.nlm.nih.gov/),输入accession number搜索,我查阅一些文献是关于通城猪的(SRX510749
)(Li X, et al. 2014. Genome-wide scans to detect positive selection in Large White and Tongcheng pigs. Anim Genet. 45(3):329–339 )

2.因此返回点击进入tongcheng_pool,出现如下界面,这里是这个数据的具体信息。

3.点击进入其中一个run

4.进入上面一栏的Download--FASTA/FASTQ

6.选择数据及数据格式点击右面的Download 进行下载。

 

 

GEO(Gene Expression Omnibus)是一个公共基因表达数据存储库,包含来自各种生物组织和细胞类型的数百万个基因表达数据集。GEO数据下载分析的主要目的是获取和处理GEO存储库中的数据。以下是SRA、SRR、GEM、SRX、SAMN、SRS、SRP、PRJNA等常见的GEO数据下载分析术语及其解释: 1. SRA (Sequence Read Archive):SRANCBI的一种存储测序数据的格式,是一种原始的测序数据文件。SRA文件包含了原始的测序数据、测序质量数据以及测序的元数据(如测序平台、测序仪器、测序试剂等)。 2. SRR (Sequence Read Run):SRR是SRA的子集,包含一个或多个测序文件,通常对应于一个测序运行。SRR文件可以通过SRA文件下载。 3. GEM (GEO Metadata):GEM是GEO存储库中的元数据,包括实验设计、样本信息、平台信息等。GEM文件可以通过SRX文件下载。 4. SRX (Sequence Read Experiment):SRX是一个实验的唯一标识符,包含了实验设计、样本信息、平台信息等元数据。SRX文件可以通过SRA文件或GEM文件下载。 5. SAMN (Sample accession number):SAMN是NCBI为每个样本分配的唯一标识符。 6. SRS (Sample Run Set):SRS是样本和测序运行的集合,也是一个实验的唯一标识符。SRS文件可以通过SAMN文件或SRX文件下载。 7. SRP (Study Reference Population):SRP是一个研究项目的唯一标识符,包含了一个或多个实验(SRX)和样本(SAMN)。 8. PRJNA (Project accession number):PRJNA是NCBI为每个研究项目分配的唯一标识符,包含了一个或多个研究项目(SRP)。 GEO数据下载分析的步骤: 1. 在GEO网站上搜索所需的数据集,并记录下相关的SRR、SRX、SAMN等标识符。 2. 下载SRA文件,使用NCBI SRA Toolkit软件将其转换为FASTQ格式,提取测序序列和其质量信息。 3. 使用FastQC软件评估测序数据的质量。 4. 使用Trimmomatic等软件进行数据预处理和质量控制。 5. 将处理后的测序数据对应到参考基因组上,进行数据分析和解释。 6. 对结果进行可视化和统计分析。 总的来说,GEO数据下载分析需要具备一定的生物信息学技能和相关的软件工具。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangchuang2017

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值