常常会有老师要求小编帮忙做普氏分析,尤其是微生物组和宏基因组相关的项目。这次小编索性把所有的分析一次性处理好。
Q:什么是普氏分析?
随着高通量测序的普及,常规的相关性分析已经无法满足科研工作者的需要,于是业内大咖把用于人脸识别的分析方法放到了生物信息学中。普鲁克分析(Procrustes Analysis) 又名普氏分析,是一种用来分析形状分布的统计方法。应用在数据分析中,可以理解为比较两组数据一致性的方法,主要用于表示样品不同方面的数据关联度。在宏基因组测序中, Procrustes分析常用于解释细菌组成与耐药基因的相关性(Fig. 1),细菌与功能基因的相关性;在转录组测序中, Procrustes分析可用于解释基因与表型的相关性等;在物种分类中,普氏分析可以解释不同基因对物种鉴定的一致性(Fig. 2)。
Procrustes分析的过程如下:1)首先对原始数据进行降维;2)通过降维结果分布图进行“中心叠加、大小缩放、图形翻转、形状比较”等变换过程,将两组学数据的样本分布叠加在同一个低维空间,计算点坐标之间的偏差平方和(M2值) ;3)打乱样本点分布,重新计算M2值,基于原始M2值在抽样分布中的出现概率,计算显著性P值。4)计算对应点坐标之间的偏差(称为矢量残差,vector residuals),矢量残差越小代表了两数据集具有更高的一致性。
Q:如何做Procrustes Analysis?
鉴于普氏分析的需求量比较大,小编和他的小伙伴们开发了一个在线的作图小网站——云