生信|甲基化数据处理(?)

本文介绍了如何处理SRA格式的生物信息学数据,讲解了SRA数据的分类(Studies, Experiments, Samples, Runs)以及如何使用sra-tools中的fastq-dump将SRA格式转换为fastq,包括单端和双端测序数据的转化方法,并提供了Linux中批量转化的初步操作。" 92760370,8337261,数据库设计:深入理解三范式,"['数据库理论', '数据库设计', '关系数据库', '数据规范']
摘要由CSDN通过智能技术生成

首先,朋友下载的数据是sra格式(sequence read archive二代测序数据)

“我们一般从 NCBI SRA 数据库下载的高通量测序数据均为 SRA 数据,需要通过 sra-tools 中的工具转换成 fastq 格式。”

一些背景知识:
SRA数据分类

根据SRA数据产生的特点,将SRA数据分为四类:

  • Studies-- 研究课题
  • Experiments-- 实验设计
  • Samples-- 样品信息
  • Runs-- 测序结果集

这四种分类有一个层次关系。首先是Studies->Experiments->Samples->Runs。这也是一个研究项目正常的逻辑关系。了解这个层级关系,否则找sra数据就会感觉比较混乱。
一个study可能包含多个Experiment,Experiments包含了Sample、DNA source、测序平台、数据处理等信息。
SRA数据库用不同的前缀加以区分:

  • ERP或SRP表示Studies;
  • SRS 表示 Samples;
  • SRX 表示 Experiments;
  • SRR 表示 Runs。
sra-tools
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值