- 博客(2)
- 收藏
- 关注
原创 【机器学习自学笔记7】主成分分析(PCA)
PCA(Principal Component Analysis) 是一种常见的数据分析方式,常用于高维数据的降维,可用于提取数据的主要特征分量。维数灾难维数灾难(Curse of Dimensionality):通常是指在涉及到向量的计算的问题中,随着维数的增加,计算量呈指数倍增长的一种现象。在机器学习中,随着数据集维数的增加,数据的计算量将呈几何倍数增加,同时样本间的距离会远远增大,这将导致样本数据失去其意义。为了减少计算量、增加准确度,我们有必要按照一定的规则去除一些维度 (特征),这便
2020-11-16 17:07:09 217
原创 【机器学习自学笔记6】高斯混合模型(GMM)
我们知道生活中的很多现象,比如身高体重的分布,都满足高斯分布 (正态分布)。而高斯混合模型,则是通过多个高斯分布的叠加,实现对数据集的拟合。高斯分布如果学过概率论,我们知道高斯分布的公式如下:X∼N(μ,σ2)X \sim N(\mu,\sigma^2)X∼N(μ,σ2)生活中的很多现象,比如身高,都近似一种高斯分布:考虑一个问题,如果有一组数据,其中包括男性和女性的身高,比起使用一个高斯分布,使用两个高斯分布拟合的效果是不是更好呢?然而,我们只知道数据集,并不知道分布的参数,高斯混合
2020-11-02 20:43:04 745
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人