目录
智能技术_1:安装TensorFlow和Keras
智能技术_2:大数据分析与机器学习概论
智能技术_3:关联规则
# 写于2021.03.27
# 本文为学习笔记,侵删
# 操作时 中文会出现乱码 不知道为啥 还没改正
# 总结不易 望赞鼓励
1 重要概念
1.1 关联规则 定义
关联规则(association rules)主要是从庞大数据中撷取出一系列变量和因子间的关系,以探索数据的变量和项目间隐含的关系;
1.2 【若 x 则 y】表示
若是下雨天,则雨伞销售量增加
若购买尿布,则一并购买啤酒
可以表示为:x => y
1.3 条件概率
已知X事件发生的情况下,再发生Y事件之概率,称为条件概率根据X事件信息,分析事件Y的发生概率:
【例子】
- 共有四笔交易, N = 4;
- 购买汉堡©共有3笔交易纪录,故nC = 3,Pr© = 75%;
- 购买尿布(A)且购买汉堡©,共有2笔交易纪录,故Pr(A∩C) = 2/4 = 50%;
- Pr(A|C) = Pr(A∩C)/Pr© = 50%/75% = 67%;
1.4 支持度(support)【重要 】
支持度衡量项目x和项目y一起出现的概率:Pr( X ∩ Y );
【刚才那个例子】:
Support(C => A) = Pr(A∩C) = 2/4 = 50%;
1.5 信赖度(Confidence)【重要】
信赖度衡量前提项目X发生的情况下,结果项目Y发生的条件概率为:
根条件概率表达形式一样
【刚才那个例子】:
Confidence(C => A) = Pr(A|C) = Pr(A∩C)/Pr© = 50%/75% = 67%
1.6 增益值(lift)【重要】
增益值衡量用于比较信赖度与结果项目Y单独发生时两者概率的大小,即:
【刚才那个例子】:
Life(C => A) = Pr(A|C)/Pr(A) = (C发生前提下A发生概率 )/( A单独发生的概率)
= Confidence(C => A) / Pr(A) =67% / 75% = 89.3%
2 Apriori方法应用
2.1 例一
假设