![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习实战
REA_UTOPIA
这个作者很懒,什么都没留下…
展开
-
K-近邻算法
文章结构 一、算法思想 二、代码及注解(代码来源于书中) 一、算法思想 K-近邻算法是一种分类方法,其基本思想是:给定一堆 样本(特征) - 标签 数据集,对于新的只有特征的测试样本,选择有标签数据集中与测试样本距离最近的K个样本,然后取这K个样本中样本数量最多的标签作为测试样本的标签。 二、代码及注解(代码来源于书中) 2.1 kNN算法 def原创 2017-11-18 15:50:09 · 268 阅读 · 0 评论 -
决策树
文章结构: 一 、算法思想 二、关键代码及注解(代码源于书中) 一、算法思想 步骤: (1)原始样本数据矩阵化,形式如下图所示 (2)按照原始矩阵的标签值,计算数据集还未划分时的熵 (3)对数据集中每一个特征,按照特征值的取值划分数据集,形成不同的子数据集,并计算子数据集的熵。 (4)选择使熵增最大的划分方式选择相对应的特征为最佳划分特征。 (5)判断子数据集的标签是原创 2017-12-09 15:54:11 · 280 阅读 · 0 评论