搜索引擎之技术架构精简版 最后的“网页排序”,应该是考虑了“链接”(也就是网页重要度高的放前面)和“相关性” 网页去重:SimHash; 链接分析:PageRank求网页重要度; Cache系统:常用Query的结果缓存;