机器学习模型简介
李应健
这个作者很懒,什么都没留下…
展开
-
高斯混合模型GMM
GMM聚类 高斯混合模型可以看做是K-means思想的一个扩展,改进了K-means的不足之处 K-means相当于在以每个簇的中心为圆点,然后画一个圆,圆内的点都属于本簇,对于两个圆交集的地方,交集内的点属于哪个簇K-means方法也没有很好地解决办法 import numpy as np import pandas as pd import matplotlib.pyplot as plt i...原创 2019-11-27 15:31:46 · 345 阅读 · 0 评论 -
K-means算法
K-means算法属于EM(expectation-maximization)期望最大化算法的一种,简单来说,它包含两个步骤: 1.随机猜测一些中心点 2.重复至收敛 a.期望步骤(E-step):将点分配至最近的簇中心点 b.最大化步骤(M-step):将簇中心点更新为簇中所有点的平均值 期望步骤不断更新每个点属于哪个簇,最大化步骤不断更新簇中心。 有几个需要注意的问题: 1.可能不会达到全局最...原创 2019-11-27 10:40:35 · 311 阅读 · 0 评论 -
流形学习
PCA虽然灵活,快速,但是它对存在非线性关系的数据处理效果不太好。流形学习可以弥补这一缺点,流形学习是相对于PCA的另一种无监督学习算法,它将一个低维度流行嵌入到高维度空间来描述数据。 流形学习方法包括:多维度标度法(MDS),局部线性嵌入法(LLE),保距映射法(Isomap) 为了方便说明,先生成一个‘HELLO’形状的数据点 import numpy as np import pandas ...原创 2019-11-26 20:59:06 · 796 阅读 · 0 评论 -
主成分分析(PCA)
主成分分析 简介 本篇文章是阅读’数据科学手册‘的读书笔记 主成分分析是一种应用最为广泛的无监督学习算法之一,可用于数据可视化,噪音过滤,特征抽取和特征工程等。 我们生成一些随机数据来演示PCA import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns sns.set()...原创 2019-11-26 17:02:08 · 641 阅读 · 0 评论 -
朴素贝叶斯简介
朴素贝叶斯 朴素贝叶斯是一种速度很快的分类算法,适用于数据特征维度很高的情况。它假设数据的特征之间相互独立,这也是“朴素”这一名称的由来,其数学基础是贝叶斯定理。 根据每个特征的数据分布的假设不同,有高斯朴素贝叶斯,多项式朴素贝叶斯,伯努利朴素贝叶斯。 高斯朴素贝叶斯 高斯朴素贝叶斯假设每个特征的数据服从高斯分布,也就是正态分布 在scikit-learn中运用高斯朴素贝叶斯: from skl...原创 2019-11-26 14:05:09 · 1454 阅读 · 0 评论