分类1：Fisher（LDA）处理iris（鸢尾花）数据集代码

王小葱鸭

已于 2023-03-01 09:19:40 修改

阅读量1.4k

点赞数

分类专栏：机器学习文章标签：分类机器学习 python

于 2022-09-24 11:40:46 首次发布

本文链接：https://blog.csdn.net/ww596520206/article/details/127023196

版权

机器学习专栏收录该内容

1 篇文章

订阅专栏

1 介绍

使用sklearn中的LDA处理鸢尾花数据集，理论知识详见西瓜书或者sklearn文档即可，只对代码进行说明。LDA在降维的时候需要注意维度要小于原有维度，或者N-1，N表示类别的数目

2 导入模块

import pandas as pd  # 导入pandas库
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.metrics import accuracy_score
from sklearn.utils import shuffle
import matplotlib.pyplot as plt

3 导入数据集

path = "iris.data"
df = pd.read_csv(path, header=None)

4 划分训练集和测试集

df = shuffle(df)
r = int(len(df) * 0.7)
train_data = df[:r]
test_data = df[r:]
train_x = train_data.loc[:, :3]
train_y = train_data.loc[:, 4]
test_x = test_data.loc[:, :3]
test_y = test_data.loc[:, 4]

5 训练和预测

n_components = 1  # 修改不同的维度
a_list = []  # 用来存放准确率
clf = LinearDiscriminantAnalysis(solver='svd', n_components=n_components) 
clf.fit(train_x, train_y) 
test_pred = clf.predict(test_x)
a = accuracy_score(test_y, test_pred)
a_list.append(a)

6 绘图

figure = plt.figure()
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.plot(list(range(num)), a_list)
plt.title("Iris数据-Fisher判别分析-数据随机打乱-维度{}-准确率图像".format(n_components))
plt.show()