聚类大家应该都听说过,但是双聚类想必大家接触的比较少,今天我们就给大家介绍下双聚类,首先看下基础的定义:针对二维数据进行处理的算法。假设给定矩阵M,寻找到矩阵M的多个子矩阵A,对于每一个A满足其指定条件进行聚类,最后得到需要的子矩阵B。目前广泛的模型有四种:矩阵等值模型、矩阵加法模型、矩阵乘法模型和信息共演变模型。接下来在R语言中的实现需要用到包biclust。其安装如下:
install.packages(“biclust”)
然后,我们来看下此包的使用。首先是数据的预处理函数包括discretize、binarize。
1. Discretize主要是将表达矩阵转化为间隔等级的离散矩阵,其中的主要参数是quant主要是用来确定是否用分位数来划分等级。Nof来确定等级的水平。实例:
library(biclust)data(BicatYeast)
discretize