【机器学习基础】PCA主成份分析算法

特征提取和特征选择(Feature Extraction and selection)

特征提取:主成分分析 PCA:principal component analysis 1947

特征选择:自适应提升算法 AdaBoost 1995

所需数学知识:协方差 线性代数 矩阵求导

特征提取问题描述:

特征选择问题描述:

对于特征提取问题,nn其实也是个提取问题,这里的PCA就类似于一个单层的有M

个神经元的神经网络。

 

主成分分析的流程:寻找使方差最大的方向 并在该方向投影


这里ai是一个向量,P是样本的个数。

A是M*N的矩阵可以看做是M个行向量,

X是一个样本维度是N维。

是一个向量,P是样本的个数。

问题转化如下:

 

为什么最大化的问题转化成:这里减去均值的意思就是相当于找一个坐标系,在该坐标系下首先找一个向量ai,所有样本在新的坐标系下有了新的坐标,ai和所有样本的内积即为在新的坐标下的投影,然后求和求最大方差。

但是

也即

整理一下,原问题转化如下:是一个求条件极值问题,拉格朗日数乘法。

这里涉及到矩阵求导。

此时的a1就是我们求的第一个向量,二维已经可以降到一维。

 

对于高维情况,继续要求特征值和特征向量,找其他的方向投影最大。

这个方向要求和a1正交。

 

问题转化为如下:

面证明bata等于0

同样的道理可以求A矩阵其他向量。

 

PCA算法总结如下:计算样本得到的协方差计算特征值 和 特征向量,并排序。

样本本来是N * P 转化成了 M * P的矩阵。

对于样本的特征值也可以用SVD快速求出。

图片来自于浙江大学胡浩基教授上课的板书。侵权删。

 

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
浙江大学人工智能课程课件,内容有: Introduction Problem-solving by search( 4 weeks) Uninformed Search and Informed (Heuristic) Search (1 week) Adversarial Search: Minimax Search, Evaluation Functions, Alpha-Beta Search, Stochastic Search Adversarial Search: Multi-armed bandits, Upper Confidence Bound (UCB),Upper Confidence Bounds on Trees, Monte-Carlo Tree Search(MCTS) Statistical learning and modeling (5 weeks) Probability Theory, Model selection, The curse of Dimensionality, Decision Theory, Information Theory Probability distribution: The Gaussian Distribution, Conditional Gaussian distributions, Marginal Gaussian distributions, Bayes’ theorem for Gaussian variables, Maximum likelihood for the Gaussian, Mixtures of Gaussians, Nonparametric Methods Linear model for regression: Linear basis function models; The Bias-Variance Decomposition Linear model for classification : Basic Concepts; Discriminant Functions (nonprobabilistic methods); Probabilistic Generative Models; Probabilistic Discriminative Models K-means Clustering and GMM & Expectation–Maximization (EM) algorithm, BoostingThe Course Syllabus Deep Learning (4 weeks) Stochastic Gradient Descent, Backpropagation Feedforward Neural Network Convolutional Neural Networks Recurrent Neural Network (LSTM, GRU) Generative adversarial network (GAN) Deep learning in NLP (word2vec), CV (localization) and VQA(cross-media) Reinforcement learning (1 weeks) Reinforcement learning: introduction

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值