目录
【题目描述】
假设在某一固定选区美国国会选举的投票结果用 中的向量 表示为
假设我们用这种类型的向量每两年记录一次美国国会选举的结果,同时每次选举的结果仅依赖于前一次选举的结果,则刻画每两年选举的向量构成的序列是一个马尔可夫链。对此链,作为
个随机矩阵的例子,取
标志为 “ D ” 的第一列中的数值刻画在一次选举中为民主党投票的人在下一次选举中将如何投
票的百分比。
这里我们已经假设 70%的人在下一次选举中再一次投 “ D ” 的票,20%的人将投 “ R ” 的票,10%的人将投 “ L ” 的票。
对 P 的其他两列有类似的解释,图1 给出这个矩阵的一个图表。
(图1)从一次选举到下一次选举投票的变化情况
【题目要求】
预测共和党获票数
【问题分析】
如果这些 “转换” 百分比从一次选举到下一次选举多年保持为常数,则那些给出投票结果
的向量的序列构成一个马尔可夫链。
假设在一次选举中,结果为:
确定下一次可能的结果和再下一次可能的结果。
【问题解答】
下一次选举的结果由状态向量 描述,再下一次选举的结果由 描述,其中
此时,我们仅计算了 “ 下一次结果 ” 和 “ 再下一次结果 ”
【思考一下1】
Q1:题目中的 矩阵有什么含义?
A1:此处的 相当于一阶差分方程中的 ,当向量在 中的一个马尔科夫链描述一个系统或实验的序列时, 中的元素分别列出系统 在 n 个可能的状态中的概率,或实验结果是 n 个可能结果之一的概率。
因此, 通常被称作状态向量。
Q2:马尔科夫链与一阶差分方程有什么关系?
A2:马尔科夫链可用一阶差分方程刻画。
eg:,k = 0,1,2,...
Q3:题目中的 矩阵有什么含义?这个含义是怎么产生的?
A3:事实上给出了下一次选举的结果。
假设1000 个人在“第一次”选举中投票,550人投 D 的票,400 人投 R 的票,50人投 L 的票(见 中的百分比)。在下一次选举中,550人中的 70%将再一次投 D 的票,400人中的 10%将从 R 转投 D ,50人中的 30%将从 R 转投 D 。
于是 D 的总得票数为:
0.70 * (550) + 0.10*(400) + 0.30*(50) = 385 + 40 + 15 = 440 (等式1)
结论:于是下一次 D 候选人将得 44%的选票。
(等式1)中的计算本质上与计算 中第一个元素是相同的,对 中其他元素以及 中的元素等可以作类似的计算。
Q4:这样看来,马尔科夫链有着 " 预言 “ 的作用,那么多次选举后,关于投票的情况能说些什么?初试状态对最终结果有影响吗?
A4: 经过多轮投票后,马尔科夫链将趋于一个向量。(注意,不是一个具体的数字)即 “ 稳态向量 ”。
没有影响。
利用 “ 预言” 性质,我们继续解题
Q5:如何计算 ?
A5:若先选 再计算 ,那么你已经出错了。
错不在计算量大或麻烦(就算计算量大,计算机也能帮我们解决),而是,我们不能把握 中元素的极限值。
正确方法:先计算稳态向量,再借助定理18,利用矩阵P,通过对角线上每个元素减去 1 得到(P - I ),再将增广矩阵进行化简:
化简运算:
的通解为 ,, 是自由变量。选,得到解空间的一组基,它的每个元素是整数,求得稳态向量如下,它们的元素和为1:
中的元素刻画由现在开始多年之后进行的一次选举中得票数的分布 ( 假设这个随机矩阵连续
描述从一次选举到下一次选举的变化情况)。这样,最终大约 54%的选票被共和觉候选人得到。
【思考一下2】
Q6:why稳态向量和是1?稳态向量可能出现负值吗?
A6:稳态向量就是概率向量,和为1,满足概率三公理之一。不可能出现负值。
Q7:随机向量一定是方阵吗?如果不是方阵会怎样?
A7:一定是方阵。计算会出错。
经过之前的学习,我们知道,Markov chain 由概率向量和随机向量构成,而一阶差分方程刻画了它,若深究其原因,需要用到子空间的知识。