欢迎关注微信公众号《生信修炼手册》!
WGCNA是目前非常火热的一项研究内容,其全称为weighted correlation network analysis, 直译就是加权基因相关性网络分析。通过这项分析,可以鉴定共表达的基因集合,这样的集合称之为modules, 而且可以将modules与表型数据进行关联分析,挖掘潜在的mark 基因。
这个高大上的分析内容的第一步就是构建基因之间的共表达网络,共表达是常用的分析相关性的一种策略,直接通过线性相关函数来计算相关性,比如pearson, spearman等相关系数,每两个基因之间可以计算出一个相关系数,那么如何构建出相关性网络呢?
在基因的相关性网络中,每个节点代表一个基因,节点之间的连线用来表示两个基因的相关性。在传统的相关性分析中,通常会给定一个阈值,比如相关系数的绝对值必须大于0.9,才认为这两个基因间存在相关性。对应的公式如下
S表示两个基因间的相关系数的绝对值,公式如下
注意是绝对值,因为协同变化的基因可以是正相关,也可以是负相关。给定一个阈值,如果两个基因之间的相关系数大于该阈值,则认为这两个基因存在相关性,在网络图中就用一条线将这两个基因连接起来;如果小于该阈值,则不存在相关性。
通过阈值筛选