NGS数据格式介绍

一般情况下,从Illumina平台上得到的测序,其数据格式是Fastq格式,可以称之为原始数据(Raw data)。事实上直接的下机数据是显微拍摄得到的图像信息。但是一般都会用Bcl2Fastq软件将图像信息转化成Fastq文件。
 
如果测序是SE:则只有一个fastq文件,如果是PE测序,则得到两个Fastq文件。
PE的数据特点有:
(1)两个Fastq文件中分别包含数据1和2,来区分前后端;
(2)这2个文件的行数必须一致;
(3)相同的行上的数据来自同一条DNA片段双末端的测序数据;
(4)Fastq以每4行为一个单位,表示一条reads的信息。
@HISEQ:6:1101:1703:2071#GCAATGGC/1
AGAATGCGTCATTCTGCGGAACTCATCCGACTGAATACCGAAAAGCAGAATCTGATCCTGGTTTCT
GCCATAAAGTAGCGCGAGCACACAGACGTCTGCGCGCCTGCGGTGACGGCGGTGCGGGT
+
`\```fdbeaeddf]d_ffNddPP\dedd]N[XPdffP\NeNdbff]faeafPdeff]PbPPP[efP^YePY\edfefO[
NNNbcM_effc\OcfcOWbffffMXcaMcffa_cYcYYbccYM]b
第一行 序列名称
第二行 序列的碱基组成
第三行 序列信息,或者直接以“+”做标记
第四行 碱基的质量
现在的Illimina使用的质量格式为Phred+33,和Sanger的碱基质量基本一致;碱基质量使用Q(Phred值)表示,其计算公式为:

碱基质量与错误率的关系为:

 

转载于:https://www.cnblogs.com/freescience/p/7476398.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值