首先需要知道什么是无监督?
监督学习,就是人们常说的分类,可通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型,再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的。
无监督学习是事先没有任何训练样本,需要直接对数据进行建模。
聚类就是在样本没有标注的情况下,对样本进行特征提取并分类,属于无监督学习的内容。
那么无监督聚类有什么作用呢?
无监督聚类主要用于特征提取分类,具体到生物学研究领域,其能根据提供的样本数据(如基因表达芯片数据),来评价其相关性和可能的分组方案。
该方法在癌症基因组学尤其是分子层面的新子类研究中已得到普及。
注!!!!可以结合GCBI进行无监督聚类的实验。。。。。。。