- 博客(3)
- 资源 (6)
- 收藏
- 关注
原创 关联分析
【摘自《数据挖掘导论》】关联分析用于发现隐藏在大型数据集中的有意义的联系,例如通过分析大量购物单发现购买奶粉的人同时也购买了尿布。所发现的联系可以用关联规则或频繁项集的形式表示。以购物为例,每个账单可以看做一个事务,每个商品为一个“项”,包含0个或多个项的集合称为一个项集。账单{啤酒,尿布,牛奶}包括项集{啤酒,尿布}但不包括项集{啤酒,可乐}。关联规则是形如X→Y的蕴涵表...
2014-06-28 19:10:47 128
原创 决策树与熵、Gini不纯度计算
要使用决策树,就必须计算不纯度,计算公式有熵和基尼不纯度熵和基尼不纯度计算公式为:[img]http://dl2.iteye.com/upload/attachment/0098/3496/7248ded5-a3b7-3f10-8e10-62dec99ef209.jpg[/img]举个例子,假设有样本:[table]||A1|A2||B1|2|8|...
2014-06-22 11:59:01 4160
原创 距离和相似度
总结一下模式识别中的距离和相似度计算方式一.距离首先介绍闵科夫斯基距离:[img]http://latex.codecogs.com/svg.latex?\left&space;(&space;\sum_{k=1}^{n}\left&space;|&space;x_{k}-y_{k}\right&space;|^{r}&space;\right&space;)\tfrac{...
2014-06-15 17:16:28 247
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人