Kaggle:使用MNIST数据集进行PCA降维和LDA降维

最新推荐文章于 2025-03-26 19:37:50 发布

Cape0915

最新推荐文章于 2025-03-26 19:37:50 发布

阅读量1.7w

点赞数 20

分类专栏：机器学习文章标签：降维 PCA LDA Kaggle

本文链接：https://blog.csdn.net/capecape/article/details/79163454

版权

本文介绍了如何在Kaggle上使用PCA和LDA对MNIST数据集进行降维。PCA通过最大化方差来寻找新特征，而LDA作为监督学习方法，旨在最大化类间距离。实验结果显示，LDA在数据点的聚类上表现更优。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

关于PCA（主成分分析，Principal components analysis）,这里有非常通俗易懂的文章解释：主成份分析(PCA)最详细和全面的诠释，这里就不多啰嗦了，下面主要介绍PCA算法和LDA算法在MNIST数据集上的应用。
主要参考的是Kaggle上的一篇Kernel，也可以直接去看这篇Kernel，这里附上链接：Interactive Intro to Dimensionality Reduction

python代码：

导入一些基本的库

import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

import plotly.offline as py
py.init_notebook_mode(connected=True)
import plotly.graph_objs as go
import plotly.tools as tls
import seaborn as sns
import matplotlib.image as mpimg
import matplotlib.pyplot as plt
import matplotlib

# Import PCA
from sklearn.decomposition import PCA