机器学习
Kevin_ _
把生活记录下来
展开
-
决策树算法
决策树的思想:就是寻找最纯净的划分方法。纯度的另一面就是不纯度。不纯度的选取有很多种方法,每种方法形成了不同的决策树算法。ID3算法使用了信息增益 作为不纯度, C4.5算法使用了信息增益率作为不纯度。 CART算法使用了基尼系数作为不纯度(分类的枝叶只有两个,形成了二叉树) 决策树要达到最纯净的划分的目标要干两件事,建树和剪枝。上图是 根据14条记录,分析是否买电脑的事件。1.假设不按转载 2017-09-27 21:30:33 · 238 阅读 · 0 评论 -
机器学习准备工作
安装 python安装 pip安装 anaconda 安装 Scikit-learn注意1:第3步要在 第4步前面因为Scikit-learn 依赖 NumPy 、SciPy而 anaconda 是一个科学计算的python类库的大集合 其中包含 NumPy 、SciPypip 是一个安装类库工具注意2: python版本要选择同一个, anaconda下载安装包时,要选择python版本。原创 2017-11-08 22:21:43 · 190 阅读 · 0 评论 -
机器学习分类篇-最邻近规则分类KNN
最邻近规则分类算法(K-Nearest Neighbor),Cover和Hart在1968年提出了最初的邻近算法,也被称为基于实例的学习或懒惰学习,与决策树算法相比,处理训练集的时候并不建立任何模型,进行分类时才将测试样例和所有已知实例进行比较进而分类。如上图,主要有两种色块,蓝色方块和红色三角,对绿色未知圆点进行判断分类,其属于红色还是蓝色? KNN算法一般可以分为两步,为了判断未知实例的类别,转载 2017-09-28 13:37:19 · 242 阅读 · 0 评论