机器学习实战
文章平均质量分 76
AndyCao9527
向上走,即使一小步,也是新高度
展开
-
机器学习实战第三章(决策树)
第二章介绍的k-近邻算法可以完成很多分类任务,但是最大缺点是无法给出数据的内在含义,决策树的主要优势就在于数据形式非常容易理解。 决策树: 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据 缺点:可能会产生过度匹配问题 树用数据类型:数值型和标称型。在构造决策树时,我们需要解决的第一个问题就是,当前数据集上哪个特征在划分数据分类时起决原创 2017-03-30 15:47:56 · 967 阅读 · 1 评论 -
kNN近邻算法
伪代码(1)计算已知类别数据集中的点与当前点之间的距离 (2)按照距离递增次序排序 (3)选取与当前点距离最小的k个点 (4)确定前k个点坐在类别出现的频率 (5)返回前k个点出现频率最高的类别作为当前点的预测分类# -*- coding: UTF-8 -*- from numpy import * import operatordef createDataSet(): grou原创 2017-06-27 22:46:20 · 429 阅读 · 0 评论