![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
分类算法
AmazingJadeWu
Github:https://github.com/amazingWu
开源中国:https://git.oschina.net/WU_QI
展开
-
决策树分类算法
最近在学习数据挖掘,算法的重要性可想而知,先学习下理论,本篇是关于决策树算法,参考了一些博客,觉得写的非常不错。后面会结合代码来实现这些算法,并尝试着使用mahout等框架来使用这些算法解决实际的问题转载 2016-10-26 15:56:22 · 13051 阅读 · 0 评论 -
机器学习初涉--贝叶斯分类
贝叶斯定理 这个定理解决了现实生活里经常遇到的问题:已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B|A)。这里先解释什么是条件概率: P(A|B) 表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为:。 贝叶斯定理之所以有用,是因为我们在生活中经常遇到这种情况:我们可以很容易直接得出P(A|原创 2017-05-06 11:31:30 · 789 阅读 · 0 评论 -
机器学习初涉--k近邻算法
在此对k近邻算法做一个简单的总结:原理K-近邻方法通过计算每个训练样例到待分类样品的距离,取和待分类样品距离最近的k个训练样例,k个样品中哪个类别的训练样例占多数,则待分类原组就属于哪个类别。 在实践中往往通过若干次实验来确定K值,取分类误差率最小的K值。特点KNN方法主要依靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别,因此对于类域的交叉或者重叠较多的待分类样本集来说,KNN方法更原创 2017-05-10 10:28:15 · 656 阅读 · 0 评论 -
机器学习实战--朴素贝叶斯
使用Python进行文本分类要从文本中获取特征,需要先拆分文本,具体如何做呢?这里的特征是来自文本的词条,一个词条是字符的任意组合。可以把词条想象为单词,也可以使用非单词词条,如URL、IP地址或者任意其他字符串。然后将每一个文本片段表示为一个词条向量,其中值为1表示词条出现在文档中,0表示词条未出现。此处以社区留言为例,为了过滤侮辱性的言论,我们使用1 和 0 来代表是侮辱类和非侮辱类。首先会给出原创 2017-06-29 23:20:40 · 231 阅读 · 0 评论 -
机器学习实战--决策树分类
关于决策树的讲解,在另一篇博客中我给过介绍,有兴趣的可以看下相关的内容,建议不了解原理的先了解决策树的原理,弄清算法的流程和几个基本概念。决策树分类算法 以下师python的决策树实现,采用的是信息增益来选取最好的属性,即 ID3算法: 参考机器学习实战,在实践中,给了一点自己的注释,希望能帮助大家理解。# encoding:utf-8from math import logimport原创 2017-06-24 17:14:21 · 341 阅读 · 0 评论