数据挖掘
文章平均质量分 89
Seek_Joy
联系方式:milletpu@milletpu.com
展开
-
【数据挖掘】FPgrowth算法笔记
1. 提出问题对于Apriror算法来说,仍然受到两种非平凡开销的影响:仍然需要产生大量的候选集。例如,如果有10^4个频繁1项集,则需要产生10^7个候选频繁2项集。可能需要重复地扫描整个数据库。检索数据库中每个事务来确定候选项集支持度的开销会很大。所以,我们需要设计一种方法,挖掘全部频繁项集而无须这种代价昂贵的候选产生过程。即,不需要产生如此大量的候选集,同时在确定候选集支持度时不需要重复原创 2016-09-20 22:35:37 · 2980 阅读 · 0 评论 -
【杂谈】RBF径向基核函数&径向基网络
径向基函数径向基函数(Radical Basis Function,RBF)方法是Powell在1985年提出的。所谓径向基函数,其实就是某种”沿径向对称”的标量函数。通常定义为空间中任一点x到某一中心c之间欧氏距离的单调函数,可记作k(||x-c||),其作用往往是局部的,即当x远离c时函数取值很小。例如高斯径向基函数: 当年径向基函数的诞生主要是为了解决多变量插值的问题,可以看下面的图。具体的转载 2016-02-29 15:30:54 · 2408 阅读 · 0 评论 -
【杂谈】MATLAB插值方法简介
在应用领域中,由有限个已知数据点,构造一个解析表达式,由此计算数据点之间的函数值,称之为插值。实例:海底探测问题某公司用声纳对海底进行测试,在5×5海里的坐标点上测得海底深度的值,希望通过这些有限的数据了解更多处的海底情况。并绘出较细致的海底曲面图。一元插值一元插值是对一元数据点(xi,yi)进行插值。1. 线性插值:由已知数据点连成一条折线,认为相临两个数据点之间的函数值就在这两点之间的连线上。原创 2016-02-14 17:33:24 · 1840 阅读 · 0 评论 -
【数据挖掘】Aprior算法笔记
关联规则我的理解是,关联规则表示是多种事物之间的联系。这样讲有点模糊,看一下具体的吧。我们一般会说“一般买了牙膏的人还喜欢再买牙刷”,“很多人买了锅子一定会再买一个锅盖”,这样的联系就叫做关联规则,也就是可以表示为“牙膏=>牙刷”,“锅子=>锅盖”。请注意,这里的“一般”、“很多人”这种不确定的词汇,可以通过数据挖掘给出确定的比例或者概率,也就是之后谈到支持度(support)置信度(confide原创 2015-10-17 06:24:06 · 1232 阅读 · 0 评论 -
【数据挖掘】拉格朗日乘子法和KKT条件
参考自: http://blog.csdn.net/xianlingmao/article/details/7919597转载 2016-10-13 01:35:01 · 826 阅读 · 0 评论 -
【数据挖掘】再谈page rank
http://blog.csdn.net/hguisu/article/details/7996185 http://www.cnblogs.com/FengYan/archive/2011/11/12/2246461.html原创 2016-11-02 00:29:38 · 596 阅读 · 0 评论