项集挖掘——Eclat->dEclat的python实现

def Sigma(sequence):
sigma=set()
for itemset in sequence:
for item in itemset:
if item not in sigma:
sigma.add(item)
return sigma

def VirticalDataset(sequence,sigma,minsup):
dic={}
for item in sigma:
itemset=set()
for i in range(len(sequence)):
if item in sequence[i]:
itemset.add(i)
if len(itemset)>=minsup:
dic[item]=itemset
return dic

def UniversalSet(sequence):
dic={}
list=[]
s=set()
for i in range(len(sequence)):
s.add(i)
list.append(s)
list.append(len(s))
dic[’ ']=list
return dic

def changed(tao,dic):
for name in dic.keys():
list=[]
list.append(tao[’ '][0]-dic[name])
list.append(len(dic[name]))
dic[name]=list
return dic

def dElact(minsup,wait,dic):
kdic={}
sup=0
d=set()
for waitname in wait.keys():
for name in dic.keys():
if name not in waitname and name>waitname[len(waitname)-1]:
list = []
d = dic[name][0]
for i in range(len(waitname)):
d=d-dic[waitname[i]][0]
sup=wait[waitname][1]-len(d)
if sup>=minsup:
list.append(d)
list.append(sup)
kdic[waitname+name]=list
return kdic;

if name == ‘main’:
minsup=3
sequence=[[‘A’,‘B’,‘D’,‘E’],[‘B’,‘C’,‘E’],[‘A’,‘B’,‘D’,‘E’],[‘A’,‘B’,‘C’,‘E’],[‘A’,‘B’,‘C’,‘D’,‘E’],[‘B’,‘C’,‘D’]]
sigma=Sigma(sequence)
dic=VirticalDataset(sequence,sigma,minsup)
tao=UniversalSet(sequence)
dic=changed(tao,dic)
print(dic)
sequentialitem = dElact(minsup, dic, dic)
print(sequentialitem)
sequentialitem = dElact(minsup,sequentialitem,dic)
print(sequentialitem)
sequentialitem = dElact(minsup, sequentialitem, dic)
print(sequentialitem)

最后几行完全可以使用递归,这里懒得写了。

本人才疏学浅,如有问题还望即使纠正。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值