Java 计算26个英文字母的状态转移矩阵(C++统计文章字母个数,MATLAB计算熵)

问题描述

计算一篇英文文章里26个英文字母的状态转移矩阵,以及这篇文章含有的信息熵

(一)问题分析

  1. 首先统计文章里字母总数

  2. 计算状态转移矩阵P
    把a字母后面出现a的概率记为aa,即a后面出现a的个数÷a的总个数,则矩阵P表示为:
    aa ab ac … az
    ba bb bc … bz

    za zb zc … zz

  3. 求该矩阵对应特征向量C
    即求解 ( P T − E ) X = 0 (P^T-E)X=0 (PTE)X=0的非0解(正常情况下只有一个,即该矩阵的秩为25,原矩阵 r a n k ( P ) = 26 rank( P)=26 rank(P)=26),再归一化

  4. 计算信息熵 H ∞ = C ∗ H ( P ) H_{\infty}=C*H(P) HCH(P)

(二)问题求解

1.统计字母总数
  • 满意:通过编程实现了对任意一篇英文文章的自然语言熵的计算
  • 不足:没有考虑非英文字符串的情况,情况考虑不全面
//C++ 统计字母总数
#include <iostream>
using namespace std;
int main() {
   
char ch;
char s_letter[26]={
   'a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z'
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值