信息检索
文章平均质量分 79
twtwffg
这个作者很懒,什么都没留下…
展开
-
网络爬虫关键技术分析与实现
1搜索引擎的发展的历史<br /> 1990年以前,没有任何人能搜索互联网。所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage,Peter Deutsch.BillWheelan发明的Archie(Archie FAQ)。一个可以用文件名查找文件的系统,于是便有了Archie.Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。1995年12月,Altavista永远改变了搜索引擎的定义。AltaVist转载 2010-12-13 01:12:00 · 4491 阅读 · 0 评论 -
基于网页分块的搜索引擎排序算法改进
<br />一、传统搜索引擎排序算法<br />1. 1 搜索引擎排序算法概述<br />搜索引擎查询的结果按照一定的规则排序供用户查看, 这种规则就是搜索引擎排序算法. 目前几种比较通用的搜索引擎排序算法有Direct Hit 排序算法、PageRank、排名竞价服务和词频位置加权排序算法.Direct Hit 排序算法是一种动态排序算法, 搜索引擎返回的排序结果根据用户的点击和网页被浏览的时间进行变化. PageRank 是著名搜索引擎Google 使用的排序算法, 利用了网页的链接结构进行计算网页的转载 2011-01-07 09:45:00 · 769 阅读 · 0 评论