【python】香浓熵计算

香农熵的公式:
不理解的可以看这个博文:傻子都能看懂的——信息熵(香农熵https://www.zhihu.com/question/22178202/answer/161732605
在这里插入图片描述

一个很通俗的例子解释香农熵:
来源:全国地研联:干货分享 | 城市功能混合程度计算 https://www.sohu.com/a/437716289_169228
在这里插入图片描述

代码

首先说一下我的数据。
主要数据,一列Name,一列percentage,分别是名字和比例。同上面通俗易懂的图对照,name就是不同区域,percentage就是用地分类占比。
代码gpt初稿,人工改的细节并根据需要做了修正

import csv
import math
import pandas as pd

def calculate_shannon_entropy(csv_file, name_column, percentage_column):
    name_values = {}
    total_count = 0

    # 读取CSV文件
    with open(csv_file, 'r',encoding='utf-8-sig') as file:
        reader = csv.DictReader(file)

        for row in reader:
            name = row[name_column]
            percentage=float(row[percentage_column])
            
            if name in name_values:
                name_values[name].append(percentage)
            else:
                name_values[name]=[percentage]
        
            total_count += 1
        print('共读取 '+str(total_count)+' 行数据')
        print(name_values)

    entropy = 0.0
    result=[]   
    # 计算每个分类的熵值
    for values in name_values.values():
        count=len(values)  
        # 计算每个值的熵值
        value_entropy = sum(-p * math.log2(p) for p in values if p>0)
        print(value_entropy)
        result.append(value_entropy)
        entropy=value_entropy
    
    df = pd.DataFrame({'entropy': result, 'Names': list(name_values.keys())})
    print(df)
    df.to_csv(r"XXX.csv",
                  header=True,encoding="utf_8_sig",index=False)
    return entropy

csv_file = "XXX.csv"
name_column = 'Name'  # 替换为名字列的列名
percentage_column = 'percentage'  # 替换为poi分类列的列名

shannon_entropy = calculate_shannon_entropy(csv_file, name_column, percentage_column)
print("最后一个香浓熵:", shannon_entropy)
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值