聚类（二）

最新推荐文章于 2023-09-11 22:20:50 发布

WxyangID

最新推荐文章于 2023-09-11 22:20:50 发布

阅读量502

点赞数

分类专栏：机器学习文章标签：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WxyangID/article/details/78868515

版权

机器学习专栏收录该内容

22 篇文章 1 订阅

订阅专栏

k-means 的结果是每个数据点被 assign 到其中某一个 cluster 了属于硬化分。
而 GMM 则给出这些数据点被 assign 到每个 cluster 的概率，又称作 soft assignment （软化分）。

在机器学习中，一个学习算法也会有一个前提假设，这里被称作“归纳偏执 (bias)”。例如线性回归，目的是要找一个函数尽可能好地拟合给定的数据点，它的归纳偏执就是“满足要求的函数必须是线性函数”。
GMM就是假设数据服从 Mixture Gaussian Distribution ，换句话说，数据可以看作是从数个 Gaussian Distribution 中生成出来的。

高斯混合模型（Gaussian Mixture Model, GMM）是一种概率式的聚类方法，属于生成式模型，它假设所有的数据样本都是由某一个给定参数的多元高斯分布所生成的。具体地，给定类个数K，对于给定样本空间中的样本，一个高斯混合模型的概率密度函数可以由K个多元高斯分布组合成的混合分布表示：

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

WxyangID CSDN认证博客专家 CSDN认证企业博客

码龄8年

119: 原创

7万+: 周排名

97万+: 总排名

49万+: 访问

: 等级

5223: 积分

34: 粉丝

99: 获赞

32: 评论

418: 收藏

私信

关注

热门文章

分类专栏

IDEA 4篇
Ubuntu16.04 27篇
Python 51篇
Java 7篇
数据库 7篇
MySQL 2篇
mongoDB
操作系统 1篇
算法数据结构 2篇
机器学习 22篇
常用 1篇
c语言 3篇
myeclipse 4篇
pycharm 2篇
xshell 2篇
Linux 4篇
计算机网络 1篇
hivesql
spark 1篇
leetcode 2篇

最新评论

import cv2出现“ImportError: DLL load failed: 找不到指定的模块”
yzlcpgl: 博主，你拯救了我查了一天的坑给解决了
pip install opencv问题ImportError: OpenCV loader: missing configuration file: ['config-3.6.py', 'conf
凌晨三点lili: 命令输入在哪啊大哥
GridSearchCV参数
wangyuyang08: 您好，楼主。如果数据中有类型（标签）数据，怎样去保证网格搜索交叉验证GridsearchCV每一折中不同类型数据比例和原始数据比例保持一致，谢谢。
GridSearchCV参数
wangyuyang08: 你好，因为原始数据带有标签，譬如说4种草地植被类型。这样在GridsearchCV的时候怎么保证每一折数据比例与原始数据一致。在GridsearchCV这一步怎样去设置 kflod = StratifiedKFold(n_splits=10, shuffle = True,random_state=7)#将训练/测试数据集划分10个互斥子集，
使用Git往github上提交代码时出现[packet_write_wait connection to xx.xx.xx.xx Broken pipe]错误的解决办法：
SiegfriedG: 果然有用

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。