数据挖掘
epluguo
这个作者很懒,什么都没留下…
展开
-
贝叶斯分类器
贝叶斯分类是统计学的一个分类方法,基于贝叶斯定理。首先贝叶斯分类的一个核心假设是一个属性值对给定类的影响独立于其他属性的值(类条件独立)。 先来看下条件概率: 设A、B是两个事件,且P(B)>0,则称 为在事件B发生的条件下,事件A的条件概率。 再来看一下贝叶斯定理:。 其中: X 是类标识未知的数据样本(或数据元组) 如:35岁收入$4000的顾客原创 2014-05-31 09:03:18 · 1808 阅读 · 0 评论 -
Apriori算法
Apriori算法是数据挖掘中一种挖掘关联规则的频繁项集算法。其核心是基于两阶段频集思想的递推算法。 先来了解下关联规则挖掘: 发现事务数据库,关系数据, 或其它信息库中项或数据对象集合间的频繁模式。关联,相关,或因果关系结构。 频繁模式:在数据库中频繁出现的模式(项集, 序列, 等)。 动机是发现数据中的规律性。 如: 购物篮分析:哪些产品更经原创 2014-05-31 10:54:45 · 2747 阅读 · 0 评论