这里我们在hadoop平台下面实现Pagerank算法
输入文件格式如下:
1 1.0 2 3 4 5 6 7 8
2 2.0 3 4 5 6 7 8
3 3.0 4 5 6 7 8
4 4.0 5 6 7 8
5 5.0 6 7 8
6 6.0 7 8
7 7.0 8
8 8.0 1 2 3 4 5 6 7
拿第一行进行说明: 1表示网址 然后用tab键隔开,记住一定要是tab键,1.0为给予的初始pr值,2,3,4,5,6,7,8为从网址1指向的网址
下面几行都是如此
代码如下:
package com.apache.hadoop.io;
import java.io.IOException;
import java.text.DecimalFormat;
import java.text.NumberFormat;
import java.util.StringTokenizer;
import java.util.