设minsupport=0.4,利用Apriori算法求出所有的频繁项集,指出最大频繁项集。
数据集:
代码实现:
# 设minsupport=40%,利用Apriori算法求出所有的频繁项目集,指出其中的最大频繁项目集。
import pandas as pd
def get_D():
D = pd.read_csv("work1.csv",index_col='TID')
D = D['Itemset'].values.tolist()
for i in range(len(D)):
D[i] = D[i].split(',')
return D
def get_C1(D):
C1=[]
for index in D:
for item in index:
if not [item] in C1: