Python线性判别分析（LDA）——数据降维

最新推荐文章于 2024-05-19 11:41:35 发布

bats421

最新推荐文章于 2024-05-19 11:41:35 发布

阅读量3.5k

点赞数 3

分类专栏： # 机器学习文章标签： python 机器学习降维 LDA 深度学习

本文链接：https://blog.csdn.net/weixin_43616817/article/details/113181653

版权

Python线性判别分析（LDA）——数据降维

手动实现LDA
使用Sklearn完成LDA

附：
Pandas文档链接
 sklearn文档链接

手动实现LDA

读取数据

采用鸢尾花数据

数据链接https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data
在这里插入图片描述
数据集共3类，共有150条花的基本数据，三种花各50条，每条数据包括萼片长度，萼片宽度，花瓣长度，花瓣宽度4种特征

使用pandas读取数据集，代码：

import pandas as pd

# 显示所有列
pd.set_option('display.max_columns', None)
# 显示所有行
pd.set_option('display.max_rows', None)
# 增加每行的宽度
pd.set_option('display.width', 1000)

df = pd.read_csv(
    filepath_or_buffer='iris.data',
    header=None,
    sep=',',
)

# 自定义列名
feature_dict = {
   
    i: label for i, label in zip(
        range(4),
        (
            'sepal length in cm',
            'sepal width in cm',
            'petal length in cm',
            'petal width in cm',
        )
    )
}

# 指定列名
df.columns = [l for i, l in sorted(feature_dict.items())] + ['class label']
print(df.head(150))  # 返回前n行数据

输出如下：
在这里插入图片描述

转换标签

from sklearn.preprocessing import LabelEncoder

X = df[['sepal length in cm',
        'sepal width in cm',
        'petal length in cm',
        'petal width in cm']].values
y = df['class label'].values
# 制作标签 {1:'Setosa', 2:'Versicolor', 3:'Virginica'}
enc = LabelEncoder()
label_encoder = enc.fit(y)
y = label_encoder.transform(y) + 1

使用sklearn中的LabelEncoder完成标签转换，分两步走，先fit再transform，转换结果如下：
在这里插入图片描述

最低0.47元/天解锁文章

bats421

关注

3
点赞
踩
45

收藏

觉得还不错? 一键收藏
0
评论
Python线性判别分析（LDA）——数据降维

Python线性判别分析（LDA）——数据降维读取数据附：Pandas文档链接sklearn文档链接读取数据采用鸢尾花数据数据链接https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data数据集共3类，共有150条花的基本数据，三种花各50条，每条数据包括萼片长度，萼片宽度，花瓣长度，花瓣宽度4种特征使用pandas读取数据集，代码：import pandas as pd# 显示所有列pd.set
复制链接

扫一扫

专栏目录