Java_Hadoop学习
billhellowhat
这个作者很懒,什么都没留下…
展开
-
Google矩阵
使用一款搜索引擎,我们希望搜索结果能够拥有最佳的排序,Google为它最核心的排序算法PageRank申请了专利。在PageRank以前,排序大多依靠对搜索关键字和目标页的匹配度来进行的,这种排序方式弊端明显,尤其对于善于堆砌关键字舞弊的页面,很容易就跳到了搜索结果的首页。Larry Page和Sergey Brin开始着手解决这个问题,Google排序的继承来自于互联网上网页之间的链接关系。一张转载 2013-11-28 21:41:00 · 2892 阅读 · 0 评论 -
第1周书面作业
1 参考根据幻灯片中第9页所给出的“4网页模型” ,现假设有A,B,C,D,E五个网页,其中 1)A网页有链接指向B,C,D,E 2)B网页有链接指向A,D 3)C网页有链接指向A,D 4)D网页有链接指向C 5)E网页有链接指向A,C A 请写出这个网页链接结构的Google矩阵,目测你认为哪个页面的重要性(PR值)最高? B(本题可选)手动或编程计算这5个页面的PR原创 2013-11-29 19:09:12 · 716 阅读 · 0 评论