kda lda matlab代码,机器学习初学代码（三） LDA（多分类）

最新推荐文章于 2023-04-18 09:38:56 发布

Hi-iD

最新推荐文章于 2023-04-18 09:38:56 发布

阅读量807

点赞数

文章标签： kda lda matlab代码

该博客介绍了如何利用LDA（线性判别分析）进行多分类数据的权重计算，并实现二维空间的投影点绘制，以进行数据可视化。通过`calWeights`函数计算类别内散度矩阵和类间散度矩阵，然后选取最大的K个特征值对应的特征向量作为权重。最后，`LDAplot`函数用于展示二维投影后的各类样本分布。

摘要由CSDN通过智能技术生成

# -*- coding: utf-8 -*-

# author: Xin Chen

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

# 多分类通用:

# data 的格式应该是DataFrame的格式，其中前几列为特征，最后一列为标签

# label从0开始取得数字

def calWeights(data, K):

labels = np.unique(data['label'])

cNum = len(labels)

if K >= cNum:

print 'K is too large, please input again'

exit(0)

# Sw 类内散度矩阵

dim = np.shape(data)[1]-1 # 减1是因为有label

Sw = np.mat(np.zeros((dim, dim)))

for i in labels:

datai = data.ix[data['label'] == i]

Ci = np.mat(datai.drop('label', axis=1))

ui = np.mean(Ci, axis=0)

Si = (Ci-ui).T * (Ci-ui)

Sw += Si

# St 全局散度矩阵

C = np.mat(data.drop('label', axis=1))

u = np.mean(C, axis=0)

St = (C-u).T *(C-u)

# Sb 类间散度矩阵

Sb = St - Sw

S = Sw.I * Sb

eigValues, eigVectors = np.linalg.eig(S) # 用来求特征值和特征向量

order= eigValues.argsort()[::-1]

select = order[:K]

Weights = eigVectors[:, select]

return Weights

def LDAplot(data):

# 也要注意这个函数画的是投影点而不是原始的点

w = calWeights(data, K=2)

if np.shape(w)[1] != 2:

print '维度太大，无法画图！'

return

labels = np.unique(data['label'])

C = np.mat(data.drop('label', axis=1))

CC = C * w

corlist = ['r', 'y', 'g', 'b', 'w']

for i in labels:

CCi = CC[:, data['label'] == i]

plt.scatter(CCi[:, 0], CCi[:, 1], c=corlist[i], marker="o")

plt.show()

from sklearn import datasets

iris = datasets.load_iris()

X = iris.data

Y = iris.target

data = pd.DataFrame(X)

data['label'] = Y

Weights = calWeights(data, K=2)

print "opticalweights=", Weights

LDAplot(data)

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。