数据挖掘
文章平均质量分 70
唐吉坷德Q
这个作者很懒,什么都没留下…
展开
-
序列模式
什么是序列模式 Apriori处理的数据没有考虑每个客户在超市多次购物的情况。 序列模式:一个用户在不同时间点的交易记录就构成了一个购买序列, N个用户的购买序列就组成一个规模为N的序列数据集.。 Apriori目的:挖掘出频繁集,找到其中的关联规则 对于Apriori处理的数据集设置支持度阈值为:2 则(面包机、面包)为频繁集 设置可信度为:0.7 则关联规则:面包机 面包原创 2018-01-01 00:23:59 · 3316 阅读 · 0 评论 -
子图模式
本文主要是对Xifeng Yan和Jiawei Han 发表于2002年的论文《gSpan:Graph-Based Substructure Pattern Mining》的解读子图模式:基于图的数据挖掘,挖掘图数据库中的频繁子结构Introduction 2000,Inokuchi结合Apriori算法和数学图论知识,提出了AGM算法 2001,Kuramochi对AGM进行原创 2018-01-01 19:49:38 · 1094 阅读 · 0 评论 -
社交网络中的社区发现算法
本博客主要是对Finding and evaluating communitystructure in networks ——Girvan,Newman该论文的解读。介绍相关定义GN算法连接社区之间的边介数大,社区内部的边介数小。通过删边原创 2018-01-07 23:21:52 · 10844 阅读 · 2 评论