![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习模型简介
整点啥子
这个作者很懒,什么都没留下…
展开
-
高斯混合模型GMM
GMM聚类高斯混合模型可以看做是K-means思想的一个扩展,改进了K-means的不足之处K-means相当于在以每个簇的中心为圆点,然后画一个圆,圆内的点都属于本簇,对于两个圆交集的地方,交集内的点属于哪个簇K-means方法也没有很好地解决办法import numpy as npimport pandas as pdimport matplotlib.pyplot as plti...原创 2019-11-27 15:31:46 · 362 阅读 · 0 评论 -
K-means算法
K-means算法属于EM(expectation-maximization)期望最大化算法的一种,简单来说,它包含两个步骤:1.随机猜测一些中心点2.重复至收敛a.期望步骤(E-step):将点分配至最近的簇中心点b.最大化步骤(M-step):将簇中心点更新为簇中所有点的平均值期望步骤不断更新每个点属于哪个簇,最大化步骤不断更新簇中心。有几个需要注意的问题:1.可能不会达到全局最...原创 2019-11-27 10:40:35 · 317 阅读 · 0 评论 -
流形学习
PCA虽然灵活,快速,但是它对存在非线性关系的数据处理效果不太好。流形学习可以弥补这一缺点,流形学习是相对于PCA的另一种无监督学习算法,它将一个低维度流行嵌入到高维度空间来描述数据。流形学习方法包括:多维度标度法(MDS),局部线性嵌入法(LLE),保距映射法(Isomap)为了方便说明,先生成一个‘HELLO’形状的数据点import numpy as npimport pandas ...原创 2019-11-26 20:59:06 · 816 阅读 · 0 评论 -
主成分分析(PCA)
主成分分析简介本篇文章是阅读’数据科学手册‘的读书笔记主成分分析是一种应用最为广泛的无监督学习算法之一,可用于数据可视化,噪音过滤,特征抽取和特征工程等。我们生成一些随机数据来演示PCAimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snssns.set()...原创 2019-11-26 17:02:08 · 665 阅读 · 0 评论 -
朴素贝叶斯简介
朴素贝叶斯朴素贝叶斯是一种速度很快的分类算法,适用于数据特征维度很高的情况。它假设数据的特征之间相互独立,这也是“朴素”这一名称的由来,其数学基础是贝叶斯定理。根据每个特征的数据分布的假设不同,有高斯朴素贝叶斯,多项式朴素贝叶斯,伯努利朴素贝叶斯。高斯朴素贝叶斯高斯朴素贝叶斯假设每个特征的数据服从高斯分布,也就是正态分布在scikit-learn中运用高斯朴素贝叶斯:from skl...原创 2019-11-26 14:05:09 · 1499 阅读 · 0 评论