中医证型关联规则挖掘
数据从EXCEL中获取
# -*- coding: UTF-8 -*-
def loadDatadet(infile):
f=open(infile,'r') # 只读模式打开
sourceInLine=f.readlines()
data_set=[]
for line in sourceInLine:
temp1=line.strip('\n')
temp2=temp1.split(',')
data_set.append(temp2)
return data_set
def create_C1(data_set):
"""
----------------------------------------
每个项都是候选1项集的集合C1的成员。算法扫描所有的事务,获得每个项,生成C1.
---------------------------------------
通过扫描数据集创建频繁的候选1项集C1。
Args:
data_set: 事务列表。每个事务包含多个项
Returns:
C1: 包含所有常见候选1项集的集合
"""
C1 = set()
for t in data_set:
for item in t:
item_set = frozenset([item])
C1.add(item_set)
return C1
def is_apriori(Ck_item, Lksub1):
"""
判断常用候选k项集是否满足Apriori属性。
Args:
Ck_item: ck中包含所有frequent的常用候选k -