NGS数据格式梳理01-FASTQ格式和FASTA格式详解

本文详细介绍了高通量测序(NGS)中FASTQ和FASTA两种常见数据格式,包括FASTQ的命名规则、四行结构、质量值计算,以及FASTA的描述信息和序列数据。还探讨了FASTQ质量值表示方式和传输完整性校验。
摘要由CSDN通过智能技术生成
  • 本文介绍高通量测序(NGS)中FASTQ文件命名规则FASTQ格式FASTA格式测序质量
  • 写作时间:2020.05。

本文将了解到什么?

FASTQ文件命名规则

FASTQ格式

第一行,Sequence identifier

第二行,Sequence

第三行,Quality score identifier line (consisting only of a +)

第四行,Quality score,测序质量值

质量值几个需要详细了解的点

1)该位置ASCII码怎么来的?

2)质量体系值怎么来的,怎么选?

3)为何FASTQ中该列不直接使用Q值表示质量值?

4)为何要用质量值加上质量体系值?

FASTQ传输完整性校验

FASTA格式

第一行:序列描述信息

第二行:序列数据

参考资料


FASTQ和FASTA是存储DNA序列及对应质量信息最常使用的文本文件,本文介绍Illumina平台FASTQ文件命名规则,详细格式和传输完整性校验,及FASTA格式。

  • FASTQ文件命名规则

Illumina测序仪下机FASTQ命名为(NextSeq CN500下机数据为bcl格式,经过bcl2fastq转化后名称类似),例如:

Samplexx_S53_L002_R1_001.fastq.gz

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq_21478261

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值