马尔可夫法的主要思想是:两支队伍之间的每次较量,都是弱队给强队投票的机会。举个例子如下:
设投票矩阵V中第 i 行,第 j 列的元素是vij,vij表示队伍 i 输给了队伍 j 。
对V中的各行进行归一化,得到矩阵N。
矩阵N中第二行全为0,这与悬挂结点问题类似。网页排名领域中,悬挂结点指的是没有出链的结点。解决这个问题的一种方法是将这一行的元素赋值为 1/n ,n为矩阵的行数。由此可以得到随机矩阵S。
将矩阵S转置,得到转移概率矩阵W。和PageRank算法相似,我们需要计算出这个随机矩阵W的稳态向量。该稳态向量即为W的主特征向量r,可以通过Wr = r来得到。
为了加深记忆,我动手实现了马尔可夫法,程序如下:
#include <cstdio>
#include <cmath>
int main()
{
const int n = 5;
double V[][n] = {{0,1,1,1,1}, {0,0,0,0,0}, {0,1,0,0,1}, {0,1,1,0,1}, {0,1,0,0,0}};
/* 归一化 */
double N[n][n];
double rowSum[n] = {0.0};
int i, j;
for(i = 0; i < n; i++) {
for(j = 0; j < n; j++) {
rowSum[i] += V[i][j];
}
}
for(i = 0; i < n; i++) {
for(j = 0; j < n; j++) {
if(rowSum[i] > 0) {
N[i][j] = V[i][j] / rowSum[i];
} else {
N[i][j] = 0.0;
}
}
}
/* 处理悬挂结点问题 */
double S[n][n];
for(i = 0; i < n; i++) {
for(j = 0; j < n; j++) {
if(rowSum[i] > 0) {
S[i][j] = V[i][j] / rowSum[i];
} else {
S[i][j] = 1.0 / n;
}
}
}
/* 将矩阵S转置,得到转移概率矩阵W */
double W[n][n];
for(i = 0; i < n; i++) {
for(j = 0; j < n; j++) {
W[i][j] = S[j][i];
}
}
/* 初始化评分向量r */
double r[n];
for(i = 0; i < n; i++) {
r[i] = 1.0 / n;
}
/* 用幂法迭代计算评分向量r */
double ep = 0.00000000001;
double maxBias;
double rNew[n];
do {
maxBias = 0.0;
for(i = 0; i < n; i++) {
rNew[i] = 0.0;
for(j = 0; j < n; j++) {
rNew[i] += W[i][j] * r[j];
}
}
for(i = 0; i < n; i++) {
if(fabs(rNew[i] - r[i]) > maxBias)
maxBias = fabs(rNew[i] - r[i]);
r[i] = rNew[i];
}
}while(maxBias > ep);
for(i = 0; i < n; i++) {
printf("%d: %.3lf\n", i, r[i]);
}
return 0;
}
运行结果为:
所以,5只队伍的得分依次为0.088,0.438,0.146, 0.109, 0.219 。