机器学习实战
REA_UTOPIA
这个作者很懒,什么都没留下…
展开
-
K-近邻算法
文章结构一、算法思想二、代码及注解(代码来源于书中)一、算法思想 K-近邻算法是一种分类方法,其基本思想是:给定一堆 样本(特征) - 标签 数据集,对于新的只有特征的测试样本,选择有标签数据集中与测试样本距离最近的K个样本,然后取这K个样本中样本数量最多的标签作为测试样本的标签。二、代码及注解(代码来源于书中)2.1 kNN算法def原创 2017-11-18 15:50:09 · 296 阅读 · 0 评论 -
决策树
文章结构:一 、算法思想二、关键代码及注解(代码源于书中)一、算法思想步骤:(1)原始样本数据矩阵化,形式如下图所示(2)按照原始矩阵的标签值,计算数据集还未划分时的熵(3)对数据集中每一个特征,按照特征值的取值划分数据集,形成不同的子数据集,并计算子数据集的熵。(4)选择使熵增最大的划分方式选择相对应的特征为最佳划分特征。(5)判断子数据集的标签是原创 2017-12-09 15:54:11 · 305 阅读 · 0 评论