Python计算字符串的信息熵

字符串的熵指的是字符串中包含了多少不同的字符和字符出现的频率。以下是一个计算字符串熵的Python函数:

import math

def entropy(s):
    freq_dict = {}
    for c in s:
        if c in freq_dict:
            freq_dict[c] += 1
        else:
            freq_dict[c] = 1
    entropy = 0
    s_len = len(s)
    for freq in freq_dict.values():
        p = freq / s_len
        entropy -= p * math.log2(p)
    return entropy

该函数接受一个字符串作为参数 s,并返回该字符串的熵值。该函数首先创建一个字典 freq_dict,用于存储每个字符在字符串中出现的次数。然后,计算每个字符出现的概率,并使用上式计算熵。最后返回熵值。

下面是一个使用该函数的例子:

s = 'hello world'
print(entropy(s)) # 3.1808329877700468

该例子中,字符串 s 中包含了多个重复字符,因此熵值比较低。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值