java计算信息熵_Java计算文本字符的信息熵

用熵来评价整个随机变量

equation?tex=x平均的信息量,而平均最好的量度就是随机变量的期望

,即熵的定义如下:

equation?tex=H%5Bx%5D%3D-%5Csum_xp%28x%29log_2p%28x%29

计算字符的信息熵,参考代码如下:

package sk.ann;

import java.util.Scanner;

public class InfoEntropy {

public static double Entropy(String str) {

double H = .0;

int sum = 0;

int[] letter = new int[26];//26个字符

str = str.toUpperCase(); // 将小写字母转换成大写

for (int i = 0; i < str.length(); i++) { // 统计字母个数

char c = str.charAt(i);

if (c >= 'A' && c <= 'Z') {

letter[c - 'A']++;

sum++;

}

}

//计算信息熵,将字母出现的频率作为离散概率值

for (int i = 0; i < 26; i++) {

double p = 1.0 * letter[i] / sum;//单个字母的频率

if (p > 0)

H += -(p * Math.log(p) / Math.log(2));// H = -∑Pi*log2(Pi)

}

return H;

}

public static void main(String[] args) {

System.out.println("请输入字符串:");

Scanner scan = new Scanner(System.in);

String str = scan.next();

double H = Entropy(str);

System.out.printf("%4.2f\n", H);

}

}

执行结果:

请输入字符串:

are you ok!yes i am ok!

1.58

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值