项目名称:销售商品分析(购物篮分析)
项目目的:通过客户每次购买商品的数据信息挖掘商品之间的关联关系以调整经营策略
项目过程:
观察数据的基本信息
InvoiceNo:发票号码,作为交易记录的唯一标识
StockCode:商品代码
Description:商品描述
Quantity:交易数量
InvoiceDate:开票日期,作为交易产生的日期
UnitPrice:商品单价
CustomerID:客户ID
Country:客户的国家
关联规则是要研究顾客一次性会购买的东西,所以应该对InvoiceNo进行分组,而不能按照CustomerID来分组,因为顾客可能不止一次购买东西,会有好几张发票,按照CustomerID来分组的话就会将分几次购买的东西合并成一次了。
一、导入需要的库
全部行都能输出⬇⬇
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"
导库⬇⬇
import pandas as pd
import matplotlib.pyplot as plt
from mlxtend.frequent_patterns import apriori,association_rules # apriori找频繁项集、association_rules找