欢迎关注”生信修炼手册”!
在GWAS分析中,利用卡方检验,费舍尔精确检等方法,通过判断p值是否显著,我们可以分析snp位点与疾病之间是否存在关联,然而这得到的仅仅是一个定性的结论,如果存在关联,其关联性究竟有多强呢?
很显然,我们需要一个量化指标来描述关联的强弱程度。类似于相关性检验,通过p值只能够说明两个变量是否相关。至于其相关性的大小,是正相关还是负相关,还需要结合相关系数来作出判断。在关联分析中的”相关系数”则对应两个常用的统计量, risk ratio和odd ratio。
以探究吸烟和肺癌之间的关联为例,基于的数据格式如下
肺癌 | 正常个体 | |
---|---|---|
吸烟 | a | b |
不吸烟 | c | d |
risk ratio, 也叫做relative risk, 简写为RR, 通常称之为相对风险度,是暴露组的发病率与非暴露组的发病组的比值。对于上述数据,RR的计算过程如下
吸烟组患肺癌的比例 a / (a + b)
不吸烟组患肺癌的比例 c / (c + d)
RR = (a / (a + b)) /( c / (c + d))
RR的数值大小直观的反映了暴露因素中发病率的大小,RR>1, 暴露组中发病率大于非暴露组的发病率,说明暴露因素和发病率是正相关关系,反之