C++---Apriori算法实现,频繁模式数据挖掘,最大频繁项集,闭频繁项集

这篇博客介绍了如何使用C++实现Apriori算法,通过两个小测试数据集展示了算法的应用。文章涵盖了第一组和第二组的数据分析,并提供了源码下载链接,帮助读者理解Apriori在频繁模式挖掘和求取最大闭频繁项集中的操作。
摘要由CSDN通过智能技术生成

  只能说用这个Apriori算法来练练容器的操作以及文件流的操作。这两个变得熟练了。

两个小测试数据集

第一组

测试数据第一组:
AA BB  EE
BB DD
BB CC
AA BB DD
AA CC
BB CC
AA CC
AA BB CC EE
AA BB CC
频繁项集:

这里写图片描述

最大频繁项集  

这里写图片描述

闭频繁项集

无闭频繁项集

第二组

测试数据第二组
AA BB CC
AA BB CC DD
BB CC EE
AA CC DD EE
DD EE
频繁项集

这里写图片描述

最大频繁项集

这里写图片描述

闭频繁项集

这里写图片描述

算法实现

apriori.h
#ifndef __APRIORI_H_
#define __APRIORI_H_


#include <iostream>
#include <cstdlib>
#include <map>
#include <set>
#include <fstream>
#include <string>
#include <vector>
#include <sstream>
#include <utility>

using namespace std;

class Apriori{

public:
    Apriori(string dataFileName,float minSup){
        this->dataFileName = dataFileName;
        this->minSup = minSup;
    }

/*Functions*/
public:
    void printMapSet(map< set<string> ,int> &mapSet);
    void printsetSet(set< set<string> > &);
    void printSet(set<string> &);

    int buildData();
    map< set<string>, int> getTextDatabaseFre();
    map< set<string>, int> getTextDatabaseSurpport();
    map<string, int> getCandidate1ItemSet();
    map< set<string>, int > findFrequent1Itemsets();
    set< set<string> > aprioriGen(int m, set< set<string> > &);
    bool has_infrequent_subset(set<string> &, set< set<string> > &);
    map< set<string>, int > getFreqKItemSet(int k, set< set<string> > freqMItemSet);    
    set< set<string> > keySet(map< set<string>, int > &mapSet);
    set<string> retainAll(set<string> set1, set<string> set2);
/*Functions*/
private:    
    void removeAll(set<string> &set1, set<string> &set2);
    set<string> addAll(set<string> &set1, set<string> &set2);

/*Variables*/   
private:    
    string dataFileName;
    map<long, set<string> > textDatabase;   //事务数据库
    float minSup;                           //最小支持度,(使用绝对支持度)
    long textDatabaseCount;                 //事务数据库中的事务数
    map< set< set<string> >, int > freqItemSet;             //候选项集集合
    map< set< set<string> >, int > candidateItemSet;        //频繁项集集合
};

#endif
apriori.cpp
#include "apriori.h"

void Apriori::printMapSet(map< set<string> ,int> &mapSet)
{
    map< set<string>, int >::iterator it = mapSet.begin();
    while(it != mapSet.end()){
        set<string>::iterator itSet = it->first.begin();
        cout << "#" << it->second << "\t";
        cout << "[" ;
        while(itSet != it->first.end()){
            cout << *itSet << "," ;
            ++itSet;
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值