特征表示:特征选择、特征抽取(方法概述)

以前一说数据降维,立马想到了主成分分析,最多加上个因子分析。因为是偏统计一点的。要是在多说,可能就不知道了。今天看到了别人的总结,要记下来以供以后参考。

  • 主成分分析:主成分分析应该是应用最广的数据降维方法了;而且各个软件基本上都能做,算法不难,自己编写也可以,但是这里注意一下,亲测,一些软件的PCA算出来的数,和自己编的不一样,因为我写方差的时候用的是 \frac{...}{N-1}, 这里学过数理统计的人应该知道这是因为为了使方差是无偏估计,所以用的是N-1,但是比如R软件,方差用的是\frac{...}{N}, 也就是说用的是有偏的方差。
  • 流行学习:主要的方法如下所示:

image

这个图是https://blog.csdn.net/bbbeoy/article/details/78002756转载这篇博文的。

流行学习也能够用于数据降维,不过感觉流行学习是一个比较大的分支,深入研究有点浪费时间了,用到再看吧

  •  核方法:这里不是核密度方法(手动汗),,这个核方法是支持向量机(SVM)里面的核方法。 这里不是降维了,是能够使用低维的数据表示高维的信息的一种方法。在SVM中,核方法是能够将最优化问题拓展到非线性的关键一步,,使用这个方法的好处是一般常用的核方法已经固定了,拿来使用就好了。
  • 主题模型(LDA):常用于自然语言处理
  • 度量学习:我看有的人说等价于相似度学习,,也不是很明白
  • Embedding
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值