当转录组研究的样本分组超过2组时,由于差异表达基因的识别只能针对两组样本,因此,只通过差异表达基因无法分析整体上的基因表达变化规律,此时可以通过表达模式聚类将基因按照其在不同样本中的表达变化规律进行归类,进而推测其与特定功能的可能联系。
表达模式聚类热图
以各样本中基因的表达量绘制热图,在图中每列表示一个样本,每行表示一个基因,图中的颜色的深浅表示基因在该样本中的表达量。
表达模式聚类热图
图像左侧的聚类数表示各个基因在所有样品中表达规律的相似性,在聚类中分支越近的基因,其表达量的变化规律就越接近,同一聚类模式的基因可能具有相同或相关的功能。
表达模式聚类折线图
表达模式聚类折线图的绘制过程如下:首先根据基因在不同样本中的表达量将其分为多个subcluster,之后每个subcluster分别进行绘图,图像中x轴代表不同的样本,y轴为各个基因表达量的对数值。
表达模式聚类折线图
灰色线条表示一个subcluster中的基因在不同样本中的相对表达量 (聚为一类的基因会有很多个,图中显示比较密集)。
蓝色线条表示这个subcluster中的所有基因在不同样本中相对表达量的平均值。
表达模式聚类热图通常是按照欧式距离等相关性距离计算方法进行聚类,而折线图可以根据需要人为指定分类的数目。
Venn分析
分别识别不同组样本两两之间的差异表达基因,之后进行Venn分析。
差异基因Venn分析
在图中,不同颜色的圆圈代表两组样本的差异基因,圆内部所有数字之和代表该组比较中差异基因个数的总和,圆的交叉区域代表不同比较的差异基因中共有基因个数,而最外圈单独的部分表示该组比较中特有的差异基因数目。
该分析可以识别在研究的所有过程中均发挥作用的关键基因 (所有比对组中的共有基因),也可用于识别与特定功能相关的关键基因 (各组比较中的特有基因)。