python通过信息增益的方法进行字符型离散特征之间的相关性分析

最新推荐文章于 2023-08-30 09:41:24 发布

赴前尘

最新推荐文章于 2023-08-30 09:41:24 发布

阅读量2.1k

点赞数 2

分类专栏：数据挖掘文章标签：信息增益离散特征特征相关性

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36940806/article/details/97011240

版权

在参与的数据挖掘多分类比赛中，针对包含离散特征的数据集，利用信息增益来评估这些离散特征（如accept_from）与目标特征（如CODE）的相关性。通过代码实现，参考了相关博客资源。

摘要由CSDN通过智能技术生成

参加了一个比赛，关于数据挖掘的多分类问题，特征集中包含了一些离散特征，通过计算信息增益来度量离散特征与目标特征之间的相关性

离散特征： accept_from

目标特征：CODE

代码实现：

import pandas as pd
import numpy as np


# 信息熵
def info_entropy(attr):
    prob = pd.value_counts(attr) / len(attr)   # 对于一个特征不同类所占的比例类
    return sum( np.log2( prob )* prob * (-1) )  # 经验熵



# 信息增益   （返回值越大，attr1 与 attr2 相关性越强）
def info_gain(dataset, attr1, attr2):
    ent1= dataset.groupby(attr1).apply(lambda x: info_entropy(x[attr2]))
    prob = pd.value_counts(dataset[attr1]) / len(dataset[attr1])
    ent2= sum( ent1 * prob )                   # 经验条件熵
    return info_entropy(dataset[attr2]) - ent2     #  信息增益

print(info_gain(dataset,'accept_from', 'CODE'))

参考博客： https://blog.csdn.net/sky88088/article/details/51737136

关注

2
点赞
踩
23

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

赴前尘 CSDN认证博客专家 CSDN认证企业博客

码龄8年

215: 原创

2万+: 周排名

8113: 总排名

34万+: 访问

: 等级

4657: 积分

235: 粉丝

416: 获赞

124: 评论

1221: 收藏

私信

关注

热门文章

分类专栏

最新评论

golang实现简单的TCP代理
泡芙萝莉酱: 这篇博文主题是“golang实现简单的TCP代理-CSDN博客”，博主的文章内容非常好，让我对这个主题有了全新的认识。博主在细节描写上非常到位，展现出了深厚的技术功底。希望博主能够继续分享更多有价值的文章，我们期待着能够从中受益。也希望能够得到博主的指导，一同进步。在此，衷心感谢博主的分享和支持！
git为文件添加可执行权限
CSDN-Ada助手: CS入门技能树或许可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
docker安装etcd和etcd客户端
普通网友: 大佬高质量文章，图文并茂，逻辑清晰，受益匪浅，期待大佬新作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
docker运行elastic和kibana，并使用密码连接
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
from torch._C import * dlopen: cannot load any more object with static TLS
superme JING: It seems that scikit-learn has not been built correctly. If you have installed scikit-learn from source, please do not forget to build the package before using it: run `python setup.py install` or `make` in the source directory. 这样的话报错： If you have used an installer, please check that it is suited for your Python version, your operating system and your platform. 然后我把sklearn放在最上面，这个错误没有了又报你文章中torch的错误

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

赴前尘 喜欢我的文章？请我喝杯咖啡吧！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。