关闭

Q-Q plot 在GWAS中的意思

标签: plotstatisticsheaderqq算法c
9842人阅读 评论(1) 收藏 举报
分类:

Q-Q plot 即Quantile-Quantile Plot。它在各类研究中经常用到,主要是直观的表示观测值与预测值之间的差异。

在SPSS中很容做,Analysis - Descriptive statistics - Q-Qplot。

Q-Q plot主要是用来估计数量性状观测值与预测值之间的差异。一般我们所取得的数量性状数据都为正态分布数据。在GWAS研究中Q-Q plot的X和Y轴主要是代表各个SNP的-lg P values。预测的线是一条从原点发出的45°角的虚线。实际观测值则是标的实心点。

Q-Q plot主要要点:

预测的虚线为什么是45°出来的呢?因为预测的线实际是通过在QQ图中第一象限作图得出。理论上一个点A在该图上的位置应该是A预测值=A实际值,转化为坐标就是A(x,y)x=y。所以预测的线是一条从原点发出的45°线。

观测值的点的坐标是怎么得出来的。同样设点A的坐标是(x,y)x为预测值,y为实际观测值。查了一下R 中qq plot的算法是这样的

pvals <- read.table("DGI_chr3_pvals.txt", header=T)

observed <- sort(pvals$PVAL)
lobs <- -(log10(observed))

expected <- c(1:length(observed))
lexp <- -(log10(expected / (length(expected)+1)))


具体解释是这样的,先把P值从小到大排序。lobs代表纵坐标,lexp代表横坐标,纵坐标就是观测P值的-log10,而横坐标则根据P值数目而定。比如,当只有3个P值 P1=0.0001 P2=0.001 P3=0.01,那么在这个P值组中,length(observed)=3,对于P1=0.0001 expected=1 lexp=-log10(1/3+1),对于P2=0.001 expected=2 lexp=-log10(2/3+1), P3=0.01 expected=3 lexp=-log10(3/3+1)。。。。。依此类推。

如果出现了偏离的情况说明实际值跟预测值有偏差,在GWAS研究中,那个SNP点出现了较大的偏离,则认为这个SNP位点的观测值的偏离是由这个SNP突变所产生的遗传作用造成的
0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:391319次
    • 积分:2544
    • 等级:
    • 排名:第14927名
    • 原创:9篇
    • 转载:31篇
    • 译文:2篇
    • 评论:66条
    文章分类
    最新评论