支持度(support)和置信度(confidence)是关联规则中的两个指标,代表规则的有用性和确定性。对于啤酒-尿布这个经典的关联规则:
beers=>diapers[support=10%,confidence=60%]
support=10%表示beers和diapers同时出现的概率是10%
confidence=60%表示已知购买beers的条件下,购买diapers的概率是60%(购买beers的顾客,60%也购买了diapers),所以置信度是条件概率,类似于后验概率。
支持度(support)和置信度(confidence)是关联规则中的两个指标,代表规则的有用性和确定性。对于啤酒-尿布这个经典的关联规则:
beers=>diapers[support=10%,confidence=60%]
support=10%表示beers和diapers同时出现的概率是10%
confidence=60%表示已知购买beers的条件下,购买diapers的概率是60%(购买beers的顾客,60%也购买了diapers),所以置信度是条件概率,类似于后验概率。