机器学习
文章平均质量分 92
baobaoqiyue
这个作者很懒,什么都没留下…
展开
-
聚类k-means算法 python实现
一、k-means聚类算法k-means聚类属于比较基础的聚类算法,它的算法步骤如下算法步骤: (1) 首先我们选择一些类/组等数据,首先确定需要分组的数量k,并随机初始化数据中的K个中心点(中心点表示每种类别的中心,质心)。(2) 对于数据集中的每个数据点计算这个数据点到中心点的距离,数据点距离哪个中心点最近就划分到哪一类中。 (3)得到分好的数据后,重新 计算每一类中中心点作为新...原创 2018-08-08 11:51:55 · 1135 阅读 · 1 评论 -
各种聚类算法介绍
最近项目用到聚类算法,将其系统的总结一下。一、简要介绍1、聚类概念聚类就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起,不同数据尽量分离。2、聚类和分类的区别聚类技术通常又被称为无监督学习,因为与监督学习不同,在聚类中那些表示数据类别...转载 2018-08-08 12:08:52 · 908 阅读 · 0 评论 -
决策树--ID3
今天,我来讲解的是决策树。对于决策树来说,主要有两种算法:ID3算法和C4.5算法。C4.5算法是对ID3算法的改进。今天主要先讲ID3算法,之后会讲C4.5算法和随机森林等。 Contents 1. 决策树的基本认识 2. ID3算法介绍 3. 信息熵与信息增益 4. ID3算法的C++实现 1. 决策树的基本认识...转载 2018-08-26 21:55:39 · 344 阅读 · 0 评论 -
np.linalg.norm 求矩阵的范数
x_norm=np.linalg.norm(x, ord=None, axis=None, keepdims=False)参数:①x: 表示矩阵(也可以是一维)②ord:范数类型向量的范数:矩阵的范数:ord=1:列和的最大值ord=2:|λE-ATA|=0,求特征值,然后求最大特征值得算术平方根 (非方阵求最大奇异值)ord=∞:行和的最大值③axis:处...转载 2018-12-08 15:11:26 · 671 阅读 · 0 评论