PageRank算法c++实现

首先用邻接矩阵A表示从页面j到页面i的概率,然后根据公式生成转移概率矩阵

M=(1-d)*Q+d*A                           常量矩阵Q=(qi,j),qi,j=1/n

给定点击概率d,等级值初始向量R0,迭代终止条件e;

计算Ri+1=M*Ri;

ei=|Ri+1-Ri|,当ei<=e时输出Ri+1作为最终等级值向量。

#include "fstream"
#include "sstream"
#include <iostream>
#include <set>
#include <vector>

using namespace std;

int getNum()
{
    set<int> N;
    ifstream is("a.txt");
    int u, v;
    while (is >> u >> v)
    {
        N.insert(u);
        N.insert(v);
    }
    return N.size();
}

void getPage(vector<vector<int>>& page)     //&
{
    ifstream is("a.txt");
    int u, v;
    while(is>>u>>v)
    { 
        page[u].push_back(v);
    }
}

void PageRank(vector<vector<int>>&page,int N,double d,double e,int maxIterations)
{
    //得到M
    vector<vector<double>> M(N,vector<double>(N,0.0));
   
    for (int i = 0; i < N; i++)
    {
        if (page[i].size() > 0)
        {
            for (int j : page[i])
            {
                M[j][i]++;           //0/1
                
            }
            for (int j=0;j<N;j++)
            {
                M[j][i] /= page[i].size();
            }
        }
        else
        {
            for (int j : page[i])
            {
                M[j][i] = 0;
            }
        }
    }
    for (int i = 0; i < N; i++)
    {
        for (int j = 0; j < N; j++)
        {
            //cout << M[i][j]<<" ";             //正确
            M[i][j] = d * M[i][j] + (1 - d) * (1.0 / N);
            //cout << M[i][j] << " ";
        }
    }

    vector<double> pagerank(N, 1.0);
    while (maxIterations)
    {
        vector<double> newpagerank(N, 0.0);
        double dif=0.0;
        for (int i = 0; i < N; i++)
        {
            for (int j = 0; j < N; j++)
            {
                newpagerank[i] += M[i][j] * pagerank[j];
            }
             dif+= abs(pagerank[i]-newpagerank[i]);
        }
        //cout << dif << endl;
        pagerank = newpagerank;
        if (dif < e)
        {
            //cout << maxIterations<<endl;
            break;
        }
        maxIterations--;
    }
    cout << "等级值分别为:" << endl;
    for (int i = 0; i < N; i++)
    {
        cout << pagerank[i]<<endl;
    }
}

int main()
{
    int num = getNum();
    vector<vector<int>> page(num);
    getPage(page);
    double d = 0.85;
    double e = 0.1;
    int maxIterations = 100;
    PageRank(page, num, d, e, maxIterations);

}

数据

0 1
0 2
0 3
1 0
1 2
2 3
3 0
3 1

结果 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PageRank算法是一种用于评估网页重要性的算法,它是Google搜索引擎的核心算法之一。以下是用C++实现PageRank算法的一个简单示例: ```c++ #include <iostream> #include <vector> using namespace std; // 定义网页数量 const int NUM_PAGES = 6; // 定义阻尼系数 const double DAMPING_FACTOR = 0.85; // 定义最大迭代次数 const int MAX_ITERATIONS = 100; // 定义每个网页的初始PageRank值 const double INITIAL_PR = 1.0 / NUM_PAGES; // 定义网页链接关系矩阵 double links[NUM_PAGES][NUM_PAGES] = { {0, 0, 0, 0, 0, 0}, {1, 0, 1, 1, 0, 0}, {1, 0, 0, 1, 0, 0}, {1, 1, 0, 0, 0, 0}, {0, 1, 1, 0, 0, 0}, {0, 1, 1, 1, 1, 0} }; // 计算每个网页的PageRank值 void calculatePageRank(vector<double>& pageranks) { vector<double> new_pageranks(NUM_PAGES, 0.0); // 迭代计算PageRank值 for (int iteration = 0; iteration < MAX_ITERATIONS; iteration++) { for (int i = 0; i < NUM_PAGES; i++) { double sum = 0.0; for (int j = 0; j < NUM_PAGES; j++) { if (links[j][i] == 1) { sum += pageranks[j] / (double)count_nonzero(links[j], links[j] + NUM_PAGES); } } new_pageranks[i] = (1.0 - DAMPING_FACTOR) / NUM_PAGES + DAMPING_FACTOR * sum; } pageranks = new_pageranks; } } // 输出每个网页的PageRank值 void printPageRanks(const vector<double>& pageranks) { for (int i = 0; i < NUM_PAGES; i++) { cout << "Page " << i << ": " << pageranks[i] << endl; } } int main() { // 初始化每个网页的PageRank值 vector<double> pageranks(NUM_PAGES, INITIAL_PR); // 计算每个网页的PageRank值 calculatePageRank(pageranks); // 输出每个网页的PageRank值 printPageRanks(pageranks); return 0; } ``` 在上面的代码中,我们首先定义了网页数量、阻尼系数、最大迭代次数和每个网页的初始PageRank值。然后,我们定义了一个网页链接关系矩阵,其中links[i][j]表示网页i是否链接到网页j。接下来,我们实现了一个函数calculatePageRank,用于计算每个网页的PageRank值。在这个函数中,我们使用了迭代计算的方法,每次迭代都更新每个网页的PageRank值。最后,我们实现了一个函数printPageRanks,用于输出每个网页的PageRank值。在主函数中,我们首先初始化每个网页的PageRank值,然后计算每个网页的PageRank值,最后输出每个网页的PageRank值。 需要注意的是,上面的示例代码只是一个简单的实现,实际上PageRank算法还有很多细节需要考虑,比如如何处理网页链接关系矩阵中的零元素、如何处理网页链接关系矩阵中存在的“悬挂节点”等等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值