记录篇:【百面机器学习】第五章.非监督学习---K均值聚类

问题3 针对K均值算法的缺点,有哪些改进的模型?

K 均值算法的主要缺点如下:
1 )需要人工预先确定初始 K 值,且该值和真实的数据分布未必吻合
2 K 均值只能收敛到局部最优,效果受到初始值很大
3 )易受到噪点的影响
4 )样本点只能被划分到单一的类中
改进的模型:
■ K-means++ 算法
■ ISODATA 算法

问题4 证明K均值算法的收敛性

K 均值聚类的迭代算法实际上是一种最大期望算法(Expectation-Maximization algorithm ),简称 EM 算法。 EM 算法解决的是在概率模型中含有无法观测的隐含变量情况下的参数估计问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值