四天数模,做得不好,但收获不小。最后还通宵一宿,多日后得以重获新生,特做个小记,聊记心得。
本次选题为神经元的分类和聚类,前者给定种类,需要通过训练样本找寻分类特征,再用测试样本测试分类方法的正确性。后者未给定种类,需要根据相似度找出分类。分类方法众多,比如PCA,一种简单的线性统计主成分分析方法,见参考文献【1】;又或灰度关联法,不需要任何基础知识的分类法,见参考文献【2】。这里将总结一种基于稀疏表示的分类方法。
本科期间应该很多人都学过线性相关,即若y与x1、x2……xn相关,则必有y能被x1、x2……xn线性表示。稀疏分析即基于此,只需将y看成是测试样本,x1、x2……xn当作是训练样本,如果y能被x1、x2……xn表出,则认为y属于x1、x2……xn所在类型。当然,这仅是理想状况,由于有噪声等干扰因素的存在,要使y能由x1、x2……xn精确表出,要求过于严格,需要做具体的处理,比如寻求最小残差。
因为实际上测试样本y,初始时无法肯定属于哪一个类型,它可能属于n类中的任何一类,因此我们先定义一个矩阵A,A中包含所有类的训练样本信息,A如下:
因此对测试样本y可以表示成:
y=A*X0
其中X0是系数向量