数据挖掘与机器学习算法
文章平均质量分 72
AugustWind
这个作者很懒,什么都没留下…
展开
-
机器学习算法(二)——决策树分类算法及R语言实现方法
决策树算法是分类算法中最常用的算法之一。决策树是一种类似流程图的树形结构,可以处理高维数据,直观易理解,且准确率较高,因此应用广泛。本篇小博就决策树的若干算法:ID3算法、C4.5算法以及分类回归树(CART)、C5.0进行对比介绍,并对比C4.5与C5.0处理较大数据集时的效率,观察C5.0效率提升了多少。一、概况算法名称分类属性选取标准标准描述优点缺原创 2015-04-22 15:39:07 · 3440 阅读 · 0 评论 -
机器学习算法(三)——朴素贝叶斯算法及R语言实现方法
朴素贝叶斯算法也是一种常用的分类算法,尤其在对文本文档分类的学习任务中,朴素贝叶斯分类是最有效的算法之一。所谓的朴素,即假设在给定目标值时属性值之间相互条件独立,虽然这一假设看似不合理,但其最终的分类效果却普遍较好。一、概述1、贝叶斯公式2、最大后验假设(MAP)从所有假设的集合H中选择一个假设h使得其在给定数据集D下发生的概率P(h|D)最大,即成为最大后验假设。3、极大原创 2015-04-23 09:44:16 · 6729 阅读 · 1 评论 -
机器学习算法(一)——关联规则Apriori算法及R语言实现方法
关联规则算法算是一种十分常用的机器学习算法,无论是面试还是日后工作中都会经常出现,那么本篇小博就记录一下自己学习关联规则经典算法Apriori的笔记。1、概述Apriori算法是用一种称为逐层搜索的迭代方法,从项集长度k=1开始,选出频繁的k=1项集,根据先验性质:频繁项集的子集一定是频繁的(逆否命题:非频繁项集的超集一定是非频繁的,通俗的说就是某件事发生的概率很低,比这件事发生条件更严苛原创 2015-04-20 21:19:43 · 9774 阅读 · 2 评论