欢迎关注微信公众号《生信修炼手册》!
单纯的共表达基因集合的结果并不能与我们的实验设计相关联,对于识别到的几十个共表达基因集合,一一进行富集分析去挖掘其功能,看上去如此的盲目,没有目的性,所以我们需要对共表达基因集进一步挖掘,常规的做法就是分析其中与性状相关的共表达基因,然后针对这些基因通过富集分析来研究其功能。
在WGCNA中,有两种常见的关联表型与共表达基因的方法
1. 相关性分析
这种方法要求提供每个样本对应的表型数据的值,利用这个值与module的第一主成分值进行相关性分析,根据相关性分析的结果。识别与表型相关联的modules。
表型数据示例如下
sample | weight_g | length_cm | ab_fat |
---|---|---|---|
F2_290 | 36.9 | 9.9 | 2.53 |
F2_291 | 48.5 | 10.7 | 2.9 |
F2_292 | 45.7 | 10.4 | 1.04 |
F2_293 | 50.3 | 10.9 | 0.91 |
第一列为样本,其他列代表不同的表型,尽量不要有空值,早进行相关性分析时,空值会被剔除,所以太多的空值会影响相关性分析的结果。
在识别modules的过程中,会根据module的第一主成分,即ME值合并modules, 合并之后的modules需要重新计算对应的ME值