塞翁失马

java swing Android

搜索引擎的体系结构

| 分类:首页 -> 档案 -> IT技术


搜索引擎按照功能可以分为如下几部分:

1. 巡视软件(robot/spider/crawler)

作用:自动从网上抓取信息。

2. 页面存储器

作用:将抓取回来的信息存储起来,也就是数据库。

3. 分析索引器

作用:对抓取回来的信息进行分析,建立索引。

4. 查询器

作用:根据用户的提问在索引库中进行查询,进行文档与提问相关性评价,并对将输出的结果进行排序。

在查询之前,查询器需要首先对用户输入的数据进行特征化表示,抽取其中的主题概念。

5. 用户接口

作用:提供用户与搜索引擎之间的界面,帮助用户更高效、更方便地使用搜索引擎查找信息。

具体而言,用户接口又分为三部分:(1)接受用户输入的提问;(2)将查询结果返回给用户;(3)提供用户相关反馈机制。

(完)

阅读更多
个人分类: 网络
上一篇[转帖][分享]垂直搜索引擎深度分析
下一篇爬虫/蜘蛛程序的制作[大体制作过程]
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭