机器学习实战
知更鸟女孩
改变不了沙漠,就长成仙人掌
展开
-
《机器学习实战》— k-近邻算法
目录 一、算法主要适用情形 二、算法主要实现思路 三、代码实现 1、引入numpy及后续读取目录需要引入的 2、创建数据集和标签 3、k-邻近分类算法 4、测试(0,0)的分类结果 四、应用一:使用k-邻近算法改进约会网站的配对效果 1、算法步骤 2、代码实现 (1)读取数据文件,把数据划分特征值矩阵和标签矩阵 (2)归一化特征值 (3)测试代码...原创 2019-05-08 15:04:01 · 278 阅读 · 0 评论 -
《机器学习实战》— 决策树
目录 一、决策树相关概念介绍 1、什么是决策树/判定是? 2、决策树优缺点 3、熵概念 二、决策树归纳算法 1、举个栗子 2、算法 3、树剪枝叶(避免overfitting) 三、代码实现 1、创建数据集 2、计算给定数据集的香农熵 3、按照给定特征划分数据集 4、选择最好的数据集划分方式 5、测试 6、多数表决 7、创建决策树 8、判定数据属于哪个分类 9、测...原创 2019-05-08 15:48:16 · 849 阅读 · 0 评论 -
《机器学习实战》— 基于概率论的分类方法:朴素贝叶斯
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。这篇文章我尽可能用直白的话语总结一下我们学习会上讲到的朴素贝叶斯分类算法,希望有利于他人理解。 1 分类问题综述 对于分类问题,其实谁都不会陌生,日常生活中我们每天都进行着分类过程。例如,当你看到一个人,你的脑子下意识判断他是学生...转载 2019-05-08 16:20:33 · 254 阅读 · 0 评论 -
《机器学习实战》— 基于概率论的分类方法:朴素贝叶斯
一、朴素贝叶斯算法中相关概念介绍 1、朴素贝叶斯算法优缺点 优点:可以处理多类别问题,在数据较少的情况下依然有效 缺点:对输入数据的准备方式较敏感 2、适用类型:标称型函数 3、基于贝叶斯决策的分类方法 如果p1(x,y)>p2(x,y),则(x,y)为红色一类,类别为1。 如果p1(x,y)<p2(x,y),则(x,y)为蓝色一类,类别为2。 3、什么是...原创 2019-05-08 17:21:31 · 416 阅读 · 0 评论