Kaggle digit-recognizer PCA+SVM


https://www.kaggle.com/c/digit-recognizer


参考https://www.kaggle.com/cyberzhg/digit-recognizer/sklearn-pca-svm/code

什么是PCA

  • 主分析方法(PCA),是运用线性代数的知识,找到一个k维空间(k小于n, n为原来 样本的维度)让原来的样本投影到该空间后能保留最大的差异程度,具体表现为方差。

  • 举个一个简单的例子就是,全班同学的成绩语文相差很大,从50到90分布,但是英语成绩大家都考到90多分,如果两个成绩都用同样的比重区分排名,那么英语的作用就不这么明显,而且需要考虑两科成绩。
    这时如果我新建一个新变量,对两科取不同权重,这样计算出来的新维度即能保留原来的特征,又能达到降维的效果。
    这只是帮助理解,具体实现应该有出入。

  • 具体是先把样本写成矩阵形式,求出协方差矩阵(自己跟自己的转置相乘再除于样本数)。协方差有个特殊的性质就是,对角线上的元素代表元素的方差,其他位置的元素代表协方差,就是不同元素的相关程度。

  • 这时我们需要构造一个向量,令到协方差矩阵只留下对角线上的元素,其他位置的为0,其物

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值