K-means聚类算法

K-means算法是一种无监督的机器学习算法。无监督学习即事先不知道要寻找的内容。全自动分类,将相似对象归到同一个簇中。用户预先给的K个簇,每个簇通过“质心”来描述。

伪代码:

创建K个点作为起始质心(一般随机选择)
任意一个点所属簇的结果发生改变时
    对数据集中每个点
        对每个质心
            计算数据与质心间的距离
        将数据划分到与它最近的簇
    对于每个簇,重新计算质心(所有点的均值)

求距离的方法,欧氏距离。

聚类效果的度量。一般计算SEE(误差平方和),SEE越小表示数据点越接近他们的质心。

一般误差原因:k的选取。

改进: 二分 K-均值算法
首先将所有点作为一个簇,然后将该簇一分为二。之后选择一个簇继续划分,选择哪个取决于是否可以最大程度降低SEE的值。直到取得合适的K值为止。

已标记关键词 清除标记
【为什么还需要学习C++?】 你是否接触很多语言,但从来没有了解过编程语言的本质? 你是否想成为一名资深开发人员,想开发别人做不了的高性能程序? 你是否经常想要窥探大型企业级开发工程的思路,但苦于没有基础只能望洋兴叹?   那么C++就是你个人能力提升,职业之路进阶的不二之选。 【课程特色】 1.课程共19大章节,239课时内容,涵盖数据结构、函数、类、指针、标准库全部知识体系。 2.带你从知识与思想的层面从0构建C++知识框架,分析大型项目实践思路,为你打下坚实的基础。 3.李宁老师结合4大国外顶级C++著作的精华为大家推出的《征服C++11》课程。 【学完后我将达到什么水平?】 1.对C++的各个知识能够熟练配置、开发、部署; 2.吊打一切关于C++的笔试面试题; 3.面向物联网的“嵌入式”和面向大型化的“分布式”开发,掌握职业钥匙,把握行业先机。 【面向人群】 1.希望一站式快速入门的C++初学者; 2.希望快速学习 C++、掌握编程要义、修炼内功的开发者; 3.有志于挑战更高级的开发项目,成为资深开发的工程师。 【课程设计】 本课程包含3大模块 基础篇 本篇主要讲解c++的基础概念,包含数据类型、运算符等基本语法,数组、指针、字符串等基本词法,循环、函数、类等基本句法等。 进阶篇 本篇主要讲解编程中常用的一些技能,包含类的高级技术、类的继承、编译链接和命名空间等。 提升篇: 本篇可以帮助学员更加高效的进行c++开发,其中包含类型转换、文件操作、异常处理、代码重用等内容。
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页