Kaggle:使用MNIST数据集进行PCA降维和LDA降维

  关于PCA(主成分分析,Principal components analysis),这里有非常通俗易懂的文章解释:主成份分析(PCA)最详细和全面的诠释,这里就不多啰嗦了,下面主要介绍PCA算法和LDA算法在MNIST数据集上的应用。
  主要参考的是Kaggle上的一篇Kernel,也可以直接去看这篇Kernel,这里附上链接:Interactive Intro to Dimensionality Reduction


python代码:

导入一些基本的库

import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

import plotly.offline as py
py.init_notebook_mode(connected=True)
import plotly.graph_objs as go
import plotly.tools as tls
import seaborn as sns
import matplotlib.image as mpimg
import matplotlib.pyplot as plt
import matplotlib

# Import PCA
from sklearn.decomposition import PCA

PCA

  简而言之,PCA是一种线性变换算法,它试图将我们数据的原始特征投射到更小的特征集合(或子空间)上,同时保留大部分信息。为了做到这一点,算法试图在新的子空间中找到最合适的方向/角度(即主成分),该主成分能最大化方差。为什么要最大化方差呢?请看本文的第一个链接。

MNIST数据集

  MNIST数据集是计算机视觉中的数字数据集,基本上算是机器学习中的入门级数据集了,可以到Kaggle上下载:MNIST Dataset

  • 20
    点赞
  • 119
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值