搜索引擎学习笔记(1)

1、搜索引擎的基本结构

    不同类型的搜索引擎存在不同的差异,但其基本的功能结构是相同的。通用互联网搜索引擎系统通常由 5 大部分组成:网络爬虫分析器索引器搜索器用户查询接口


搜索引擎的工作流程:
1.利用爬虫程序采集信息资源。给程序一个初始URL地址,它会以此为入口开始爬行,并沿着网页链接不断地发现新的    网页,并把爬到的网页下载到本地。
2.分析器对下载的网页进行分析及整理,并将网页重要信息提取出来。
3.利用索引器来对抽取的信息建立索引,通常采用关键字作为索引项,最后将信息存入索引数据库中。
4.当用户在用户界面输入查询信息时,索引器会从索引数据库中进行信息匹配,按相关度排序最终反馈给用户。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值