1、题目
假设每个人都只浏览下面的4个网站,下图是4个网站每天的浏览转移概率,求100天1000天后,求人们浏览4个网站的概率。起始概率重要吗?
2、题目分析
由题目可知,人们每天浏览4个网站的概率只与前一天浏览4个网站的概率有关,假设第n天人们浏览4个网站的概率别是A(n)、B(n)、C(n)、D(n),则下一天浏览四人网站的概率分别是A(n+1)=C(n)+1/2*D(n),B(n+1)=1/3*A(n),C(n+1)=1/3*A(n)+1/2*B(n)+1/2*D(n),D(n+1)=1/3*A(n)+1/2*B(n)。先假定第一天人们浏览4个网站的概率,根据以上迭代关系便可求得100天和1000天后的浏览4个网站的概率。
3、仿真结果
4、结果分析
由图1和图2可以发现,四个网站在100天和1000天后的占比都分别是0.3871、0.1290、0.2903、0.1935,由图3和图4可以发现,四个网站的浏览概率占比在19天之后会稳定下来,由图5可发现,不管第一天四个网站的浏览概率占比如何分布,其最终分布都会在19天之后稳定在某一个确定的状态。综上,可以得出结论:在马尔可夫链中,每个状态的出现只和上一状态有关,因此初始概率分布对后续的状态转移概率影响不大,即便我们使用不同的初始概率分布,最终的稳定状态概率分布仍然趋于相同的值。
5、代码
clear;
Generation(1,:) = [0.1,0.2,0.3,0.4];%第一天浏览四个网站的概率
%根据规律进行迭代
for i=2:1000
Generation(i,1) = Generation(i-1,3) + Generation(i-1,4)*1/2;
Generation(i,2) = Generation(i-1,1)*1/3;
Generation(i,3) = Generation(i-1,1)*1/3+Generation(i-1,2)*1/2+Generation(i-1,4)*1/2;
Generation(i,4) = Generation(i-1,1)*1/3+Generation(i-1,2)*1/2;
end
g = 1:i;
%画出四个网站浏览概率占比随天数增加的变化曲线
plot(g,Generation(:,1),'-.',g,Generation(:,2),'-',...
g,Generation(:,3),':',g,Generation(:,4),'*','LineWidth',2)
legend('A','B','C','D')
xlabel('Generation')
ylabel('Rate')