北京大学生物信息学学习(7)NGS 分析

第二代基因组测序
深度测序产生的FASTQ 数据
Q值会通过转化表编码成ASCI码保存在FASTQ数据中
在这里插入图片描述
通过质量信息,常将质量分数小于20,即错误概率大于0.01 的碱基认为是不可靠的,如果这样的剪辑数目超过20%将丢弃该reads。

Pair end Reads(双末端测序)

RNA-seq 快速鉴定转录组,进而确定存在的可变剪切体。
CHIP-seq 既可用于来检测转录因子的结合位点也可以探索特定的染色质修饰区域 。

深度测序中的分析方法
reads mapping (读长比对)与序列比对的差异:

之前的序列比对,认为两个序列相差不大,但是
1.在reads mapping过程中,基因组的长度长达上百兆B,而测序长度不超过100bp
2.数据量,在深度测序的过程中,产生的数据多达几十个G;
3.深度测序中产生的reads 的质量层次不齐,错误率高,

在这里插入图片描述
在reads mapping 过程中,reads相当于一个嵌入基因组中的,因此可以考虑到这个reads mapping 到基因组上的过程是局部和整体的一个比对。
基因组的局部比对,reads 的全局比对。

在这里插入图片描述

因此可以考虑到对隐含马尔可夫模型进行修正,构建模型
在这里插入图片描述

但是这个过程比对的数据量大,耗时长,因此采用BLAST 算法中的seeding and extending 的过程在进行匹配,降低时间的消耗 。
在这里插入图片描述
利用BLAST 的思路,采用seeding and extending 的算法,需要先将基因组构建索引,然后将reads 进行快速的定位,然后再通过extending 的方法进行比对。

构建索引的目的,就是将长的参考基因组的数据进行分段小化,降低搜索空间,降低搜索的时间,便于后续的快速比对和查找。
在这里插入图片描述

哈希索引方法是常见的索引方法,哈希索引长再mysql 数据库里可进行哈索引。关于哈希索引相关的信息。
关于哈希索引https://blog.csdn.net/olizxq/article/details/82313489
基因组比对中的哈希索引
在这里插入图片描述

在基因组比对过程中的哈希索引在这里插入图片描述

通过将基因组划分为一定的小区块,然后进行定区进行匹配,在这个过程中允许一定错误的比对,早期的常见的reads mapping比对方法ELAND 和MAQ 以及SOAP1 等算法,都是采用的哈希索引和抽屉原理进行早期的比对,但是这个方法,允许更多的错配,就需要将序列分解成更多的小区块,将会导致性能的下降。

在这里插入图片描述

从09年后数据压缩算法中,常用的前缀树和后缀树开始应用于数据mapping ,前缀树和后缀树也是哈希的一种 变形,主要是将海量的始数据进行压缩,并且便于后续的查找和索引 。根节点都为空。
在这里插入图片描述

目前常见的比对的方法Bowtie 以及BWA 和SOAP3等方法都是通过后缀树的思路进行比对的。

在这里插入图片描述

在构建索引后,可通过seeding 然后在进行extending的过程进行延伸比对,通过动态规划的方法确定最终的比对结果。

在这里插入图片描述

在这里插入图片描述
新一代测序的错配概率很高,那么需要考虑其是由测序的假象引起的,那么由此引入了比对质量这一概念

在这里插入图片描述
错误mapping概率 E 同时考虑了序列相似程度和测序质量,因此常使用mapping quality 而非序列分数来筛选reads mapping的位置。
在这里插入图片描述
将持续得到的reads 正确匹配到基因组上后,可以进行后续的遗传变异的分析。

常见的遗传变异 包括单核苷酸变异以及结构的变异
在这里插入图片描述

SNP calling
在这里插入图片描述

纯和变异位点
杂合变异位点
在这里插入图片描述
那么可以通过在本次的比对的过程中的出现的等位基因的概率和原始的表型,来计算对于测序的结果得到的表型概率如AA、Aa、以及aa可能得到的概率,在基于此的结果上,我们可以通过大人群样本中这一等位基因出现的概率背景知识,通过贝叶斯公式通过先验概率来计算后验概率。
在这里插入图片描述

GATK 软件的流程
在这里插入图片描述
关于回帖和变异的鉴定那么两个常用的分析方法
在这里插入图片描述

在这里插入图片描述

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值