数据挖掘
文章平均质量分 76
另眼观世界
研究方向数据挖掘,高手过招,点到不止。
展开
-
ROC曲线
在评价预测效果时,除了准确率、召回率之外,还有ROC曲线,我们先来看一下ROC的画法: 为了比较分类模型的效果,人们相应地引入了ROC(receiver operatingcharacteristic)曲线。ROC曲线是一种比较两个分类模型的有用的可视工具。ROC曲线源于信号检测理论,是第二次世界大战期间为雷达图像分析开发的。ROC曲线显示了给定模型的真正率或灵敏度(正确识别的正元组的比例)原创 2014-01-02 08:59:28 · 1613 阅读 · 0 评论 -
Apriori算法:频繁模式挖掘
1 算法思想 算法使用频繁项集性质的先验知识。Apriori使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描数据库,累积每个项的计数,并收集满足最小支持度的项,找出频繁1项集的集合。该集合记作L1.然后,L1用于找频繁2项集的集合L2,L2用于找L3,如此迭代,直到不能再找到频繁k项集。找每个Lk需要一次数据库全扫描。 Apriori性质可用于压缩搜索空间,转载 2014-03-07 10:38:22 · 1421 阅读 · 1 评论