- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 机器学习模型评估方法介绍
1.基本概念介绍:1.1经验误差与泛化误差通常把分类错误的样本数占样本总数的比例称为错误率(error rate),即如果在m个样本中有a个样本分类错误,则错误率为E=a/m。相应地,1-a/m称为精度(accuracy),而把学习器的实际预测输出与样本的真实输出之间的差异称为误差(error)。学习器在训练集上的误差称为“训练误差(training error)”或“经验误差(empirical
2017-01-20 20:09:37 832
原创 机器学习实战学习笔记11——FP-growth 算法
1.FP-growth算法概述1.1FP-growth算法介绍FP-Growth算法是韩家炜等人在2000年提出的关联分析算法,它采取分治策略:将提供频繁项集的数据库压缩到一棵频繁模式树(FP-tree),但仍保留项集关联信息。1.2FP-growth算法原理FP-growth算法使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-tree是一种特殊的前缀树,由频
2017-01-16 20:55:10 970
原创 机器学习实战学习笔记10——Apriori算法
1.Apriori概述1.1 Apriori介绍Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。该算法已经被广泛的应用到消费市场价格分析,入侵检测、电商购物推荐等领域。1.2 Apriori原理关联分析是一种在大规模数据集中寻找频繁项集和关联规则的任务。该算法的基本思想是: (1)首先找出所有的频集,这些项集出现的频繁性至少
2017-01-13 17:28:31 807
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人