《数据挖掘-实用机器学习工具与技术》学习笔记
niho
这个作者很懒,什么都没留下…
展开
-
学习笔记20140513
[插入]原创 2014-05-13 13:54:53 · 445 阅读 · 0 评论 -
4.7 INstance-Based Learning ,关于K近邻算法
点击打开链接转载 2014-05-13 14:10:11 · 652 阅读 · 0 评论 -
Chapter 4 的问题
1,winnow算法2,voting feature inervals原创 2014-05-13 20:55:39 · 454 阅读 · 0 评论 -
chapter 5.7 P168-169 Lift Charts
升图(Lift Chart)(转载自http://technet.microsoft.com/zh-cn/library/ms175428.aspx,纯粹为学习而整理,转载请标明出处)在数据挖掘设计器的“挖掘准确性图表”选项卡的“提升图”选项卡上,根据您选择的模型、该模型中的可预测属性以及其他设置,可以看到不同类型的图表。如果模型预测离散值,则可以创建提升图或利转载 2014-05-22 10:26:16 · 956 阅读 · 0 评论 -
评估分类器准确率
分类器准确性估计中,利用训练数据归纳学习获得一个分类器并利用训练数据对所得的分类器预测准确率进行估计,将会得到一个(有关该分类器准确性的)过分乐观且具有误导性的评估结果。holdout和交叉验证是两个常用的评估分类器预测准确率的技术,它们均是在给定数据集中随机取样划分数据。holdout:将所给定的数据集随机划分成两个独立部分:一个座位训练数据集,而另一个作为测试数据集,通常训练数转载 2014-06-05 14:08:09 · 3620 阅读 · 0 评论 -
Chapter5 .7 ROC Curves
阳性 (P, positive)阴性 (N, Negative)真阳性 (TP, true positive)正确的肯定。又称:命中 (hit)真阴性 (TN, true negative)正确的否定。又称:正确拒绝 (correct rejection)伪阳性 (FP, false positive)错误的肯定,又称:假警报 (false alarm),第一型错误伪阴性 (FN, f转载 2014-05-23 14:10:36 · 631 阅读 · 0 评论 -
FP树构造
FP Growth算法FP Growth算法利用了巧妙的数据结构,大大降低了Aproir挖掘算法的代价,他不需要不断得生成候选项目队列和不断得扫描整个数据库进行比对。为了达到这样的效果,它采用了一种简洁的数据结构,叫做frequent-pattern tree(频繁模式树)。下面就详细谈谈如何构造这个树,举例是最好的方法。请看下面这个例子:这张表描述了一张商品交易清单,转载 2014-06-18 19:05:43 · 2736 阅读 · 0 评论