【python】香浓熵计算

最新推荐文章于 2024-07-27 12:20:46 发布

请给我一脚

最新推荐文章于 2024-07-27 12:20:46 发布

阅读量524

点赞数 2

分类专栏：空间统计文章标签： python 香农熵 poi数据

因为左脚进入实验室被开除

本文链接：https://blog.csdn.net/Jacey_cai/article/details/131365752

版权

空间统计专栏收录该内容

4 篇文章 0 订阅

订阅专栏

香农熵的公式：
不理解的可以看这个博文：傻子都能看懂的——信息熵（香农熵https://www.zhihu.com/question/22178202/answer/161732605
在这里插入图片描述

一个很通俗的例子解释香农熵：
来源：全国地研联：干货分享 | 城市功能混合程度计算 https://www.sohu.com/a/437716289_169228
在这里插入图片描述

代码

首先说一下我的数据。
主要数据，一列Name，一列percentage，分别是名字和比例。同上面通俗易懂的图对照，name就是不同区域，percentage就是用地分类占比。
代码gpt初稿，人工改的细节并根据需要做了修正

import csv
import math
import pandas as pd

def calculate_shannon_entropy(csv_file, name_column, percentage_column):
    name_values = {}
    total_count = 0

    # 读取CSV文件
    with open(csv_file, 'r',encoding='utf-8-sig') as file:
        reader = csv.DictReader(file)

        for row in reader:
            name = row[name_column]
            percentage=float(row[percentage_column])
            
            if name in name_values:
                name_values[name].append(percentage)
            else:
                name_values[name]=[percentage]
        
            total_count += 1
        print('共读取 '+str(total_count)+' 行数据')
        print(name_values)

    entropy = 0.0
    result=[]   
    # 计算每个分类的熵值
    for values in name_values.values():
        count=len(values)  
        # 计算每个值的熵值
        value_entropy = sum(-p * math.log2(p) for p in values if p>0)
        print(value_entropy)
        result.append(value_entropy)
        entropy=value_entropy
    
    df = pd.DataFrame({'entropy': result, 'Names': list(name_values.keys())})
    print(df)
    df.to_csv(r"XXX.csv",
                  header=True,encoding="utf_8_sig",index=False)
    return entropy

csv_file = "XXX.csv"
name_column = 'Name'  # 替换为名字列的列名
percentage_column = 'percentage'  # 替换为poi分类列的列名

shannon_entropy = calculate_shannon_entropy(csv_file, name_column, percentage_column)
print("最后一个香浓熵:", shannon_entropy)

请给我一脚

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【python】香浓熵计算

香农熵的公式：不理解的可以看这个博文：傻子都能看懂的——信息熵（香农熵https://www.zhihu.com/question/22178202/answer/161732605一个很通俗的例子解释香农熵：来源：全国地研联：干货分享 | 城市功能混合程度计算 https://www.sohu.com/a/437716289_169228首先说一下我的数据。主要数据，一列Name，一列percentage，分别是名字和比例。同上面通俗易懂的图对照，name就是不同区域，percentage就是用
复制链接

扫一扫

专栏目录