代谢组是继基因组、转录组和蛋白质组之后产生的一门学科,目的是针对小分子代谢物进行高通量定性、定量分析,寻找代谢物与生理病理变化相对关系的一门学科。代谢组产生的大量数据是否令您头疼不已呢?今天,小编就带大家解析一下代谢组数据的处理流程。
代谢组学数据特点
1、 高噪声:生物体内有大量内源性小分子,但具有特定研究意义的生物标志物只是其中很少一部分,绝大部分代谢物和研究目的无关。 2、 高维、 小样本:代谢物的数目远大于样品个数,不适合使用传统的统计学方法进行分析,多维统计分析容易出现过拟合现象。 3、 高变异性:个体间的差异性、代谢物的理化性质等都会导致高变异性。 4、 关系复杂性:代谢物之间的复杂关系(相加效应及交互作用)会增加确认生物标志物的难度。 代谢组学数据处理常用方法如下图所示 。图1 代谢组学数据处理流程[1