Java文本处理7-查询文本中单个汉字的信息熵

这篇博客介绍了如何使用Java编程计算文本文档中指定汉字的信息熵。通过读取文本、统计汉字出现次数、计算概率,最终得出信息熵。示例中展示了查询汉字“道”和“一”的过程。
摘要由CSDN通过智能技术生成

1、任务简介

本节任务的目的是编写一个Java程序,用于求取文本文档中某一指定汉字的信息熵,该任务可以基于《Java文本处理3-统计文本行数、字符数、汉字、数字、字母数等》《Java文本处理4-查询文本中汉字或字符串的出现次数》来进行。


2、信息熵的计算

关于信息熵的概念我们在《信息论》这门课程中已经学习过了,信息熵具有确定性、非负性、对称性、连续性等许多重要性质,所以我们在计算它的时候要保证计算结果为正值,其基本公式为:
H ( X ) = ∑ i = 1 n p i ∗ I i = − ∑ i = 1 n p i ∗ log ⁡ 2 ( p i ) H(X)=\sum_{i=1}^{n}{p_i*I_i}=-\sum_{i=1}^{n}{p_i*\log_2(p_i)} H(X)=i=1npiIi

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值