CNV分析学习1(SNP芯片分型原理以及genomestudio部分结果展示)

芯片如何分型
SNP芯片只通过红绿两种颜色来识别SNP(相比于二代测序实在是寒酸哈哈哈哈),假设用红色信号来识别碱基A和T,用绿色信号来识别碱基G和C,再将测到的红色信号定义为Allele A,绿色信号定义为AlleleB,那么对于颠换型SNP位点,再结合设计芯片时 的SNP位点突变信息,就可识别出对应的基因型。而对于转换型SNP位点,则需要在设计探针时将该位点覆盖,然后一个监测点中需要设计两个探针,以测序信号的有无来确定基因型。我的论述有点粗糙了,这篇帖子写得很好(https://www.jianshu.com/p/264d30cc36e4/),如有需要请自行学习。
在这里插入图片描述
SNP芯片原始文件
如上所述,每个样本经SNP芯片检测后会生成两个文件,一个是红色信号强度文件,一个是绿色信号强度文件。该文件两两成对,以Grn/Red.idat结尾。一般保存在下机报告中一个已.idat结尾的文件夹中。

将该文件夹读取到genomestudio软件中,会生成类似下面这样的散点图。第一个图是信号强度生成的坐标值绘制的散点图(向量),第二个图是将图一中每个点到原点的这条直线与X轴线的角度值生成的标准化散点图,取值为0-1.这个图就是对应的分型结果。第二个图靠近0的代表这AA,靠经0.5的代表AB,靠经1的代表BB。
在这里插入图片描述由于检测时受到多种条件的影响,测定的值也是在理论值的附近波动。就像下面这样。但是只要群体数够多也可以看出来分型是成功的,并且通过聚类算法也能够成功识别对应基因型。

在这里插入图片描述当然,某些位点在某个群体里没有三种基因型也很正常,就像下面这样。
在这里插入图片描述但是当某些时候该位点的测序出现了问题时,散点图的识别就会变得不可信。
在这里插入图片描述

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值