matlab实现马尔可夫链,马尔可夫链算法(markov算法)的awk、C++、C语言实现代码...

马尔可夫链算法用于生成随机英文,通过处理文本数据形成前缀和后缀,选择前缀获取对应的后缀,不断迭代生成可读文本。awk、C++和C语言的实现代码分别展示了这一过程,awk实现简洁,C++利用关联数组,C语言使用hash表处理前缀和后缀的关系。
摘要由CSDN通过智能技术生成

1. 问题描述

马尔可夫链算法用于生成一段随机的英文,其思想非常简单。首先读入数据,然后将读入的数据分成前缀和后缀两部分,通过前缀来随机获取后缀,籍此产生一段可读的随机英文。

为了说明方便,假设我们有如下一段话:

Show your flowcharts and conceal your tables and I will be mystified. Show your tables and your flowcharts will be obvious.

假设前缀的长度为2,则我们处理输入以后得到如下数据,我们首先获取一个前缀,然后在前缀的后缀列表中随机选择一个单词,然后改变前缀,重复上述过程,这样,我们产生的句子将是可读的。

下面是处理过的数据:

前缀  后缀

show your  flowcharts tables

your flowcharts  and will

flowcharts and  conceal

flowcharts will  be

your tables  and and

will be  mystified. obvious.

be mystified.  show

be obvious.  (end)

处理这个文本的马尔可夫链算法将首先带引show your,然后随机取出flowcharts 或者table 两个单词,假设选择的是flowcharts, 则新的前缀就是your flowcharts,同理,选择table 时,新的前缀就是your table,有了新的前缀your flowcharts 以后,再次随即选择它的后缀,这次是在and 和 will 中随机选择,重复上述过程,就能够产生一段可读的文本。具体描述如下:

设置 w1 和 w2 为文本的前两个词

输出 w1 和 w2

循环:

随机地选出 w3,它是文本中 w1 w2 的后缀中的一个

打印 w3

把 w1 和 w2 分别换成 w2 和 w3

重复循环

2.awk 程序

马尔可夫链算法并不难,我们会在后面看到,用c语言来解决这个问题会相当麻烦,而用awk则只需要5分钟就能搞定。这简直就是一个演示awk优点的问题。

awk 中有关联数组,正好可以用来表示前缀和后缀的关系。程序如下:

# markov.awk: markov chain algorithm for 2-word prefixes

BEGIN { MAXGEN = 10000; NONWORD = "\n"; w1 = w2 = NONWORD }

{ for (i = 1; i <= NF; i++) { # read all words

statetab[w1,w2,++nsuffix[w1,w2]] = $i

w1 = w2

w2 = $i

}

}

END {

statetab[w1,w2,++nsuffix[w1,w2]] = NONWORD # add tail

w1 = w2 = NONWORD

for (i = 0; i < MAXGEN; i++) { # generate

r = int(rand()*nsuffix[w1,w2]) + 1 # nsuffix >= 1

p = statetab[w1,w2,r]

if (p == NO

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值