生物信息分析中的reads是什么

最新推荐文章于 2023-12-16 18:32:41 发布

wangchuang2017

最新推荐文章于 2023-12-16 18:32:41 发布

阅读量4.9w

点赞数 41

文章标签：其他

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010608296/article/details/108814576

版权

由于受目前测序水平的限制，基因组测序时需要先将基因组打断成DNA片段，然后再建库测序。reads（读长）指的是测序仪单次测序所得到的碱基序列，也就是一连串的ATCGGGTA之类的，它不是基因组中的组成。不同的测序仪器，reads长度不一样。对整个基因组进行测序，就会产生成百上千万的reads。

测序得到的原始图像数据经 base calling 转化为序列数据，我们称之为 raw data 或 raw reads ，结果以 fastq 文件格式存储， fastq 文件为用户得到的最原始文件，里面存储 reads 的序列以及 reads 的测序质量。在 fastq 格式文件中每个 read 由四行描述：

@read ID
TGGCGGAGGGATTTGAACCC
+
bbbbbbbbabbbbbbbbbbb

Single-end(SE)测序：1个fastq文件
Pair-end(PE)测序：2个fastq文件分别存放read1和read2的数据

每个序列共有4行，第1行和第3行是序列名称(有的 fq 文件为了节省存储空间会省略第三行“＋”后面的序列名称)；第2行是序列；第4行是序列的测序质量，每个字符对应第2行每个碱基，第4行每个字符对应的 ASCII 值减去64，即为该碱基的测序质量值，比如 h 对应的 A

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wangchuang2017 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。