python 计算信息熵和信息增益

autoliuweijie

于 2016-08-18 19:43:58 发布

阅读量4.3w

点赞数 16

分类专栏：机器学习文章标签： python

本文链接：https://blog.csdn.net/autoliuweijie/article/details/52244246

版权

机器学习专栏收录该内容

18 篇文章

订阅专栏

本文介绍如何使用Python计算信息熵、条件信息熵及信息增益，这些是信息论和机器学习中重要的概念，用于衡量不确定性并评估特征的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 计算信息熵

$ent$

def calc_ent(x):
    """
        calculate shanno ent of x
    """

    x_value_list = set([x[i] for i in range(x.shape[0])])
    ent = 0.0
    for x_value in x_value_list:
        p = float(x[x == x_value].shape[0]) / x.shape[0]
        logp = np.log2(p)
        ent -= p * logp

    return ent

2. 计算条件信息熵

$ent_grap$

def calc_condition_ent(x, y):
    """
        calculate ent H(y|x)
    """

    # calc ent(y|x)
    x_value_list = set([x[i] for i in range(x.shape[0])])
    ent = 0.0
    for x_value in x_value_list:
        sub_y = y[x == x_value]
        temp_ent = calc_ent(sub_y)
        ent += (float(sub_y.shape[0]) / y.shape[0]) * temp_ent

    return ent

3. 计算信息增益

ent_prap = H(Y) - H(Y|X)

def calc_ent_grap(x,y):
    """
        calculate ent grap
    """

    base_ent = calc_ent(y)
    condition_ent = calc_condition_ent(x, y)
    ent_grap = base_ent - condition_ent

    return ent_grap