Kmeans以及优化的二分Kmeans

最新推荐文章于 2022-08-24 12:07:48 发布

VIP文章 _Magic

最新推荐文章于 2022-08-24 12:07:48 发布

阅读量1.7k

点赞数 2

分类专栏：机器学习实战 with python 机器学习实战文章标签：算法优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gentle_guan/article/details/76221159

版权

利用kmeans算法进行非监督分类

1.聚类与kmeans

引例:2004美国普选布什51.52% 克里48.48% 实际上，如果加以妥善引导，那么一有小部分人就会转换立场，那么如何找到这一小部分人以及如何在有限预算采取措施吸引他们呢？答案就是聚类(<<机器学习实战>>第十章)
kmeans,k均值算法,属于聚类算法中的一种，属于非监督学习。
聚类中的一个重要的知识就是”簇”，简单说簇就是相似数据的集合，而在kmeans中主要是进行簇之间距离的运算，所以引入”质心”的概念，所谓质心就是代表这一簇的一个点(类比圆心)，由于簇中有很多点，那么质心的选取就是利用了”均值”，簇中所有点的平均值就是簇的质心，通过簇，一堆数据被分成k类，这就成了算法的名字“k均值”的直观解释.

2.kmeans伪代码以及思想

Kmeans是发现给定数据集的k个簇的算法，k是用户给定的。
主要工作流程伪代码如下

create k个点作为质心 (通常是随机选取)
while任意一个簇存在变化时
—— for 数据集中的数据点
——— for 每个质心
————- 计算质心到点的距离
————- 打擂台找到最小的两者距离记录id
——— 将数据点分配到最近的簇(打擂台记录了id)
—— 更新分配后的簇的质心(簇中所有点的均值)
返回质心列表以及分配的结果矩阵

3.二分-kmeans伪代码以及思想

主要思想
将每个簇一分为二选取最小更新

伪代码
while 簇个数小于k
—— for 每个簇
———- 记录总误差
———- 在给定的簇上进行k=2的kmeans算法
———- 计算一分为二后的总误差
—— 选择最小误差的那个簇进行划分操作
返回簇以及分配情况

kmeans错误分类
kmeans的错误分类
kmeans正确分类
kmeans的正确分类
二分-kmeans未翻车

 # -*- coding:utf-8 -*-

from numpy i

最低0.47元/天解锁文章

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
Kmeans以及优化的二分Kmeans

利用kmeans算法进行非监督分类1.聚类与kmeans引例:2004美国普选布什51.52% 克里48.48% 实际上，如果加以妥善引导，那么一有小部分人就会转换立场，那么如何找到这一小部分人以及如何在有限预算采取措施吸引他们呢？答案就是聚类(<<机器学习实战>>第十章)kmeans,k均值算法,属于聚类算法中的一种，属于非监督学习。聚类中的一个重要的知识就是”簇”，简单说簇就是相似数据的集
复制链接

扫一扫

专栏目录

_Magic CSDN认证博客专家 CSDN认证企业博客

码龄8年

123: 原创

53万+: 周排名

36万+: 总排名

15万+: 访问

: 等级

2913: 积分

68: 粉丝

138: 获赞

16: 评论

139: 收藏

私信

关注

热门文章

分类专栏

最新评论

支持向量机-数据集
vive921: 私聊一下，有问题请教
用python写单链表
前方一片光明: 宋江，卢俊义，吴用，公孙胜，关胜，林冲，秦明，呼延灼，花荣，柴进，李应，朱仝，鲁智深，武松，董平，张清，杨志，徐宁，索超，戴宗，刘唐，李逵，史进，穆弘，雷横，李俊，阮小二，张横，阮小五，张顺，阮小七，杨雄，石秀，解珍，解宝，燕青，朱武，黄信，孙立，宣赞，等108人觉得很赞。
几种二分-java
前方一片光明: 生活不能等待别人来安排，要自已去争取和奋斗;而不论其结果是喜是悲，但可以慰藉的是，你总不枉在这世界上活了一场。
记录Scala中的集合引用问题
前方一片光明: 宋江，卢俊义，吴用，公孙胜，关胜，林冲，秦明，呼延灼，花荣，柴进，李应，朱仝，鲁智深，武松，董平，张清，杨志，徐宁，索超，戴宗，刘唐，李逵，史进，穆弘，雷横，李俊，阮小二，张横，阮小五，张顺，阮小七，杨雄，石秀，解珍，解宝，燕青，朱武，黄信，孙立，宣赞，等108人觉得很赞。
Kmeans以及优化的二分Kmeans
耳东鹏: 二分法，应该是选择误差最大的来划分簇，而不是最小

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。