数据挖掘
文章平均质量分 88
oppeuro
这个作者很懒,什么都没留下…
展开
-
PrefixSpan算法详解
序列模式的概念最早是由Agrawal和Srikant 提出的。动机:大型连锁超市的交易数据有一系列的用户事务数据库,每一条记录包括用户的ID,事务发生的时间和事务涉及的项目。如果能在其中挖掘涉及事务间关联关系的模式,即用户几次购买行为间的联系,可以采取更有针对性的营销措施。原创 2016-12-12 21:24:26 · 7310 阅读 · 2 评论 -
AdaBoost算法详解
AdaBoost算法训练数据集初始化训练数据的权值分布对M=1,2,…,m使用具有权值分布Dm的训练数据集学习,得到基本分类器:计算Gm(x)在训练数据集上的分类误差率:计算Gm(x)的系数更新训练数据集的权值分布:Zm是规范化因子:构建基本分类器的线性组合AdaBoost说明:原创 2016-12-20 20:31:32 · 3071 阅读 · 0 评论 -
AdaBoost
AdaBoost 算法介绍AdaBoost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。AdaBoost算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来修改每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最原创 2016-12-20 20:51:59 · 389 阅读 · 0 评论