机器学习算法
酥酥安妮
这个作者很懒,什么都没留下…
展开
-
CART、ID3、C4.5算法及python实现
CART决策树简介决策树是数据挖掘方面一个非常重要的方法,它常常用于解决分类和预测方面的问题,是一个基于逻辑的监督式学习方法。决策树是一种以树形结构组织的规则集合, 从顶点到每个结点的路径都是一条分类规则,可以通过层层规则把数据进行切割划分到正确的类别上,它相对于其他方法来说更擅长处理一些非数值型的数据。构建决策树的过程是一个从上往下依次将数据放入各层规则中检验的过程,从包含了所有数据的根节点开始,每经过一个规则都会把数据进行划分并生成新的节点,根据规则的设定会生成叶子节点或非叶子节点,生成的非叶子节原创 2020-06-15 19:12:04 · 2000 阅读 · 1 评论 -
kNN算法及python实现
kNN算法算法概述kNN算法又称为k近邻分类(k-nearest neighbor classification)算法,可以解决分类和回归的问题。kNN算法主要是通过距离判定出训练集中离待测样本最近的k个样本,然后统计这k个样本的类别,次数最多的类别或加权后距离最小的点的类别为新数据的类别。距离越近,类别判定的准确度越高。算法原理kNN算法有3个主要因素:训练集、距离衡量、k值。训练集少且种类少的时候算法有效,训练集大的时候要使用KD树和球树的方法建立模型。距离衡量的方法有多种,目的都是搜索最近原创 2020-06-15 18:52:37 · 971 阅读 · 1 评论 -
K-Means算法及python实现
K-Means算法介绍K-Means算法是一种常用的聚类算法,也称为K-均值聚类或快速聚类法。K-Means算法将数据划分为预设的K类,以样本点到聚类中心之间的距离作为研究的评价指标,以最小平方误差作为准则函数,迭代至距离平方和趋于稳定且小于某个特定数值或达到指定迭代次数,此时聚类完成。原理K-Means算法通过确定每个样本与其聚类中心点的距离的最小值,得出聚类方案的一种算法。研究对象为连续属性时,距离判定方法有欧氏距离、曼哈顿距离、闵可夫斯基距离等,最常用的是欧氏距离;研究对象为文档数据时,常使用原创 2020-06-15 18:41:54 · 450 阅读 · 0 评论