用python计算信息增益

最新推荐文章于 2024-08-12 19:15:13 发布

stayhere_forever

最新推荐文章于 2024-08-12 19:15:13 发布

阅读量2.5k

点赞数

分类专栏：笔记文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_58091617/article/details/121411740

版权

笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

#导入相关的库
import pandas as pd 
import numpy as np

#导入题目
data=pd.DataFrame({'日志密度':['s','s','l','m','l','m','m','l','m','s'],
                 '好友密度':['s','l','m','m','m','l','s','m','s','s'],
                 '是否使用真实头像':['no','yes','yes','yes','yes','yes','no','no','yes','yes'],
                 '账号是否真实':    ['no','yes','yes','yes','yes','yes','no','yes','yes','no']})
data[['日志密度','好友密度','是否使用真实头像','账号是否真实']]

根据下列各种特征来判断微博账号是否真实

#定义计算信息熵的函数：计算Infor(D)
def infor(data):
    a = pd.value_counts(data) / len(data)
    return sum(np.log2(a) * a * (-1))
#定义计算信息增益的函数：计算g(D|A)
def g(data,str1,str2):
    e1 = data.groupby(str1).apply(lambda x:infor(x[str2]))
    p1 = pd.value_counts(data[str1]) / len(data[str1])
    #计算Infor(D|A)
    e2 = sum(e1 * p1)
    return infor(data[str2]) - e2

stayhere_forever

关注

0
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

stayhere_forever CSDN认证博客专家 CSDN认证企业博客

码龄3年

5: 原创

124万+: 周排名

158万+: 总排名

6001: 访问

: 等级

51: 积分

1: 粉丝

1: 获赞

1: 评论

29: 收藏

私信

关注

热门文章

分类专栏

笔记 4篇

最新评论

Python调用gpt接口
CSDN-Ada助手: 恭喜您写了第5篇博客！标题为“Python调用gpt接口”，我非常欣喜看到您持续创作并分享有关Python调用gpt接口的内容。您对这个主题的深入探索让我印象深刻。对于下一步的创作建议，我谦虚地建议您可以进一步探索Python调用gpt接口的一些高级用法，或者分享一些实际应用案例。这将有助于读者更好地理解和应用这个接口，并丰富他们的知识。期待看到您未来更多精彩的博客！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。