生物信息分析中的reads是什么

​由于受目前测序水平的限制,基因组测序时需要先将基因组打断成DNA片段,然后再建库测序。reads(读长)指的是测序仪单次测序所得到的碱基序列,也就是一连串的ATCGGGTA之类的,它不是基因组中的组成。不同的测序仪器,reads长度不一样。对整个基因组进行测序,就会产生成百上千万的reads。

测序得到的原始图像数据经 base calling 转化为序列数据,我们称之为 raw data 或 raw reads ,结果以 fastq 文件格式存储, fastq 文件为用户得到的最原始文件,里面存储 reads 的序列以及 reads 的测序质量。在 fastq 格式文件中每个 read 由四行描述:

@read ID
TGGCGGAGGGATTTGAACCC
+
bbbbbbbbabbbbbbbbbbb
  • Single-end(SE)测序:1个fastq文件

  • Pair-end(PE)测序:2个fastq文件分别存放read1和read2的数据

每个序列共有4行,第1行和第3行是序列名称(有的 fq 文件为了节省存储空间会省略第三行“+”后面的序列名称);第2行是序列;第4行是序列的测序质量,每个字符对应第2行每个碱基,第4行每个字符对应的 ASCII 值减去64,即为该碱基的测序质量值,比如 h 对应的 ASCII 值为104,那么其对应的碱基质量值是40。
碱基质量值范围为0到40。下表为 Solexa 测序错误率与测序质量值简明对应关系,具体计算公式如下:

Q = -10 log10P

Solexa测序错误率与测序质量值简明对应关系:

高通量测序时,在芯片上的每个反应,会读出一条序列,是比较短的,叫read,它们是原始数据;

有很多reads通过片段重叠,能够组装成一个更大的片段,称为contig;

多个contigs通过片段重叠,组成一个更长的scaffold;

一个contig被组成出来之后,鉴定发现它是编码蛋白质的基因,就叫singleton;
多个contigs组装成scaffold之后,鉴定发现它编码蛋白质的基因,叫unigene.

  • 31
    点赞
  • 113
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
### 回答1: 宏基因组分析是一种分析特定物种基因组的技术,可以确定基因组结构和功能,以及基因功能的变化。而reads分析和组装分析则是比较物种之间基因组的差异。Reads分析是比较基因组特定位点的序列,而组装分析则是定位和比较物种间基因组的结构和组成。 ### 回答2: 宏基因组是宏观遗传组成研究的一种方法,用于研究不仅细菌和古细菌,而且真菌和原生动物等非细胞型微生物的基因组。宏基因组研究可以通过bin分析reads分析和组装分析来进行。 首先是bin分析。bin分析通过将来自不同微生物的序列分组,识别出它们的组成成分。这种分析方法可以根据序列的相似性进行分类和分类微生物的进化关系。通过bin分析,我们能够了解宏基因组样品各种微生物的相对数量以及它们在生态系统的功能,进而深入理解微生物的种类和丰度。 其次是reads分析reads分析是指对宏基因组样品所得到的测序数据进行处理和分析。这种分析方法主要注重在测序数据识别和比对出各种微生物的DNA序列,以了解它们的系统演化关系和在生态系统的作用。通过reads分析,我们可以发现宏基因组样品可能存在的微生物物种,以及它们的功能和代谢特征。 最后是组装分析。组装分析是指将高通量测序数据的多个reads序列进行拼接组装,以重建出宏基因组样品的完整DNA序列。这种分析方法可以用于研究微生物的基因组结构、基因功能和遗传变异等。通过组装分析,我们可以获取到宏基因组样品生物的完整基因序列,进而深入研究微生物的遗传特征和功能。 总的来说,宏基因组的bin分析reads分析和组装分析在研究宏基因组样品的微生物组成、物种特征和遗传变异等方面具有重要作用。不同的分析方法可以帮助研究者深入理解微生物的种类和功能,为进一步研究宏基因组的生态学、进化学和生物技术应用提供了重要数据和基础。 ### 回答3: 宏基因组 bin 分析reads 分析和组装分析是在宏基因组研究常用的三种分析方法,它们各自有不同的目标和方法。 宏基因组 bin 分析指的是将宏基因组测序数据的序列根据它们所来自的微生物个体进行分类和归类。这种分析方法的目标是将序列按照来源进行排序,识别并分类微生物个体,了解某一环境存在的不同微生物的种类及其相对丰度。它以参考基因组为基础,将测序得到的序列与已知的基因组进行比对,并通过构建分类树或序列相似度进行分类。Bin 分析可以帮助研究者了解复杂环境生物的多样性和功能。 Reads 分析是指对宏基因组测序数据的每个短序列(reads)进行分析。通过比对每个 reads 与参考基因组的序列相似度,可以了解到每个个体生物基因组的内容和多样性。这种分析方法主要关注短序列个体的单个片段,而不是对整个基因组进行研究。 组装分析是将宏基因组测序数据的所有短序列尝试组装成连续的序列。将所有片段拼接在一起,得到完整的基因组信息。组装分析可以帮助研究者获得更完整、更准确的微生物基因组,从而进一步了解微生物的功能和特征。 总的来说,宏基因组 bin 分析主要关注微生物个体分类和相对丰度,reads 分析关注序列的相似度,而组装分析关注基因组的完整性和结构。这三种方法在宏基因组研究相互补充,有助于我们更全面地了解微生物的多样性和功能特征。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangchuang2017

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值