Q-Q plot 在GWAS中的意思

Q-Q plot 即Quantile-Quantile Plot。它在各类研究中经常用到,主要是直观的表示观测值与预测值之间的差异。

在SPSS中很容做,Analysis - Descriptive statistics - Q-Qplot。

Q-Q plot主要是用来估计数量性状观测值与预测值之间的差异。一般我们所取得的数量性状数据都为正态分布数据。在GWAS研究中Q-Q plot的X和Y轴主要是代表各个SNP的-lg P values。预测的线是一条从原点发出的45°角的虚线。实际观测值则是标的实心点。

Q-Q plot主要要点:

预测的虚线为什么是45°出来的呢?因为预测的线实际是通过在QQ图中第一象限作图得出。理论上一个点A在该图上的位置应该是A预测值=A实际值,转化为坐标就是A(x,y)x=y。所以预测的线是一条从原点发出的45°线。

观测值的点的坐标是怎么得出来的。同样设点A的坐标是(x,y)x为预测值,y为实际观测值。查了一下R 中qq plot的算法是这样的

pvals <- read.table("DGI_chr3_pvals.txt", header=T)

observed <- sort(pvals$PVAL)
lobs <- -(log10(observed))

expected <- c(1:length(observed))
lexp <- -(log10(expected / (length(expected)+1)))


具体解释是这样的,先把P值从小到大排序。lobs代表纵坐标,lexp代表横坐标,纵坐标就是观测P值的-log10,而横坐标则根据P值数目而定。比如,当只有3个P值 P1=0.0001 P2=0.001 P3=0.01,那么在这个P值组中,length(observed)=3,对于P1=0.0001 expected=1 lexp=-log10(1/3+1),对于P2=0.001 expected=2 lexp=-log10(2/3+1), P3=0.01 expected=3 lexp=-log10(3/3+1)。。。。。依此类推。

如果出现了偏离的情况说明实际值跟预测值有偏差,在GWAS研究中,那个SNP点出现了较大的偏离,则认为这个SNP位点的观测值的偏离是由这个SNP突变所产生的遗传作用造成的
  • 4
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值