利用亲和性分析进行商品推荐
import numpy as np
dataset_filename=("affinity_dataset.txt")
X=np.loadtxt(dataset_filename)
print(X[:5])
#面包、牛奶、奶酪、苹果和香蕉
#计算数据集中有多少个人买了苹果
num_apple_purchases=0
for sample in X:
if sample[3]==1:
num_apple_purchases+=1
print("{0}人购买了苹果".format(num_apple_purchases))
#计算数据集中有多少个人买了香蕉
num_banana_purchases=0
for sample in X:
if sample[4]==1:
num_banana_purchases+=1
print("{0}人购买了香蕉".format(num_banana_purchases))
#统计数据集中所有有规则的数据,。首先分别为规则应验和规则无效这两种情况创建字典
#“如果顾客购买了苹果,他们也会买香蕉”就用(3, 4)表示
from collections import defaultdict #使用默认字典,如果查找键不存在,会返回一个默认值
valid_rules=defaultdict(int)#有规则应验
invalid_rules=defaultdict(int)#规则无效
num_occurances=de