对pca降维后的手写体数字图片数据分类_加推数据特征工程实战

本文介绍了PCA(主成分分析)在数据降维中的应用,特别是在手写体数字图片数据分类中的实战。通过PCA算法,对数据进行标准化、归一化和降维处理,达到数据预处理的目的。文章还提供了PCA的执行步骤,包括矩阵操作、无量纲化、缺失值处理,以及PCA的JS实现和鸢尾花数据集的降维实例。最后,探讨了PCA在图像处理、人脸识别和推荐系统等领域的应用。
摘要由CSDN通过智能技术生成

加推数据特征工程实战

在机器学习或使用之前对数据进行清洗、标准化、降维等,是技术人员必不可少的技能?

从需求说起

  • 系统用户有大量的频度指标,我们希望对用户画像进行分类和打标。(分类与聚类)?
  • 产品运营有大量的指标需要分析,产生有价值的报表。(聚类)
  • 销售膜拜、电话、大客,还是团队作战,哪项行为更符合我们的产品?(分类)?

数据科学的第一步:特征工程

  • 特征工程,说白了就是对待分析的数据进行预处理、特征选择、降维等操作。?

基础知识(主要是矩阵操作)

3cbbd5c4a1375d81b7b0ae88820bbf52.png

首先随便用JS写一套 矩阵操作的函数集(编写难度很低,看着公式,中级程序猿可以轻易完成300行代码左右)?

线代基础网上很多,我们用到的也就是这些基础的组合,上一篇卷积操作会相对难一些。

  • 复制矩阵(浅copy)
  • 矩阵转置(下面会用到)
matrix.transpose = function (arr) {
    
  let result = new Array(arr[0].length)
  for (let i = 0; i 0].length; i++) {
    result[i] = new Array(arr.length)
    for (let j = 0; j       result[i][j] = arr[j][i]
    }
  }
  return result
}
  • 加法
  • 减法
  • 比例
  • 叉乘
  • 点乘
  • 矩阵行列式(det)
  • 全 0 矩阵(zero)
  • 单位矩阵(I)
  • 高斯约旦消元法
  • 求逆矩阵(inv)

封装到Sky核心库的 $.math.mat

有了这几个基础函数我们就可以完(wei)成(suo)功(yu)能(wei)?

矩阵操作就是线性转换,大部分的线性变化都会改变向量的方向

7ea6eb403a5cf7d2baaf58ec0511fe16.gif

到底有哪些有用的预处理(干货)</

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值