python实现类内类间散度矩阵,并计算其商

python实现类内类间散度矩阵,并计算其商J

1 类内类间散度矩阵的数学定义

在这里插入图片描述
参考博客:https://blog.csdn.net/weixin_38313518/article/details/76623744

2 类内距离的理解

在这里插入图片描述
参考博客:https://blog.csdn.net/ycheng_sjtu/article/details/25343043

matlab代码理解:https://blog.csdn.net/ttxzszxy/article/details/52921101

3 python实现

import numpy as np

def compute_J(encode_images, test_y):
    """
    compute the sb、 sw  and  J .
    :param encode_images: the images after encoding
    :param test_y: the label.
    :return:trace(sw) 、 trace(sb) and J
    """

    # 获取行数row(样本数)和列数column(类别数)
    _ , n_feature = encode_images.shape
    row,column=test_y.shape

    test=np.zeros(shape=(column,100,n_feature))
    P=np.zeros(shape=(column,))
    m=np.zeros(shape=(column,n_feature))
    index=np.argmax(test_y,axis=1)
    sw=0
    #  类内散度矩阵sw+各类的均值m
    for i in range(column):
        test[i] = encode_images[index==i]
        P[i]=len(test[i])/row
        m[i]=np.mean(test[i],axis=0)
        sw=sw+P[i]*np.cov(test[i],rowvar=0)    #改成以行为独立的变量

    #   类间散度矩阵sb
    for i in range(column):
        m[i]=P[i]*m[i]              #每个类的均值乘类的比列
    #   总体的均值m0
    m0=np.sum(m,axis=0)

    sb=0
    for i in range(column):
        t1=(m[i]-m0).reshape(1,n_feature)
        t2 =(m[i]-m0).reshape(n_feature,1)
        sb=sb+P[i]*np.dot(t2,t1)

    J=np.trace(sb)/np.trace(sw)

    return  J

备注:
①因为我的模型输入和提取的特征都是一行为一个样本,所以行数代表样本数,列数表示特征数;
②标签的列数代表类别数;
③我的数据是6个种类,每个类有100个样本。

相关函数参考:
np.cov()np.argmax()

若转载请注明出处,谢谢!

  • 5
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Fisher准则是一种经典的线性判别分析方法,用于将高维数据降维后实现分类。在三维模式样本分类中,我们可以利用Fisher准则将三维数据降到一维,然后通过设定一个阈值来判断分类。 具体的实现步骤如下: 1.计算每个类别的均值向量和协方差矩阵。 2.计算总体均值向量和总体协方差矩阵。 3.计算Fisher准则中的类间散度矩阵类内散度矩阵。 4.计算Fisher准则中的权重向量。 5.将三维数据投影到一维,根据设定的阈值进行分类。 示例代码如下: ```python import numpy as np # 生成三维样本数据 class1 = np.random.randn(20, 3) class2 = np.random.randn(20, 3) + 5 # 计算均值向量和协方差矩阵 mean1 = np.mean(class1, axis=0) mean2 = np.mean(class2, axis=0) cov1 = np.cov(class1.T) cov2 = np.cov(class2.T) # 计算总体均值向量和总体协方差矩阵 mean_total = (mean1 + mean2) / 2 cov_total = (cov1 + cov2) / 2 # 计算类间散度矩阵类内散度矩阵 sw = cov1 + cov2 sb = np.dot((mean1 - mean2).reshape(-1, 1), (mean1 - mean2).reshape(1, -1)) # 计算权重向量 w = np.dot(np.linalg.inv(sw), (mean1 - mean2)) # 投影到一维 class1_proj = np.dot(class1, w) class2_proj = np.dot(class2, w) # 设定阈值进行分类 threshold = (np.mean(class1_proj) + np.mean(class2_proj)) / 2 result1 = class1_proj > threshold result2 = class2_proj > threshold ``` 其中,result1和result2分别是class1和class2的分类结果,True表示属于该类别,False表示不属于。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值