手动编写计算信息熵、条件熵、信息增益、基尼指数的函数
data = pd.read_excel('customer.xlsx', engine='openpyxl')
# 信息熵
# data -> 数据框 D -> 指定变量
# 返回指定变量对应的信息熵
def H(data, D):
pk = pd.value_counts(data[D])/len(data[D])
return sum
手动编写计算信息熵、条件熵、信息增益、基尼指数的函数
data = pd.read_excel('customer.xlsx', engine='openpyxl')
# 信息熵
# data -> 数据框 D -> 指定变量
# 返回指定变量对应的信息熵
def H(data, D):
pk = pd.value_counts(data[D])/len(data[D])
return sum