搜索引擎概念:是一个用户定义的信息聚合系统。通过用户输入的查询关键词,搜索引擎推测用户的查询意图,快速返回查询结果,供用户选择。
搜索引擎有三种服务方式:
1.目录式搜索引擎
特点:检索的是网站,相当于网站的黄页。因为信息检索的过程过入了人工的操作,所以检索的结果信息准确,缺点是数据有限,人工维护成本高。
2.全文搜索引擎
特点:针对所有的网页进行的全文检索的搜索引擎。
优点:无须人工干预。
缺点:返回信息量多。
过程:
下载系统 --->索引系统-->查询系统
下载系统:依据某种策略自动地在网上搜集和下载网页
索引系统:将下载到的网页建立索引
查询系统:根据用户的查询输入,检索索引库,并将结果返回给用户
3.元搜索引擎(Meta-Search Engine)
根据用户的查询请求,同时向多个搜索引擎发送请求,将返回的结果排重过滤等处理后,返回给用户。
特点: 返回结果量大,不能充分利用原搜索引擎的功能,代表是WebCrawler。