1 搜索技术的发展历史
搜索引擎的发展经历了5个阶段和两大分类。
五个阶段:
- FTP文件检索阶段
- 分类目录导航阶段
- 文本相关性检索阶段
- 网页链接分析阶段
- 用户意图识别阶段
两大分类:
- 站内搜索
- 站外搜索
2 五大阶段
FTP文件检索阶段
该阶段搜索引擎只检索多个FTP服务器存储的文件,比如:Archie。用户搜索文件时需要输入精确的文件名来进行搜索查找,搜索引擎会告诉用户从哪一个FTP地址可以下载需要的文件
分类目录导航阶段
该阶段搜索引擎就是一个导航网站,网站中都是网址的分类陈列,用户在互联网常用的网址在这里一应俱全。比如hao123,UC导航
文本相关性检索阶段
随着页面中开始出现内容可能与网页地址和网页标题大相径庭的情况
为了解决这个问题,出现了全文搜索技术,来保证搜索引擎检索到的网页标题与网页全文内容强一致,摒弃了单纯依靠网页标题和网页地址来判断网页内容的方法。
在使用这类搜索引擎的时候,用户将输入的查询信息交给搜索引擎的后台服务器,搜索引擎的后台服务器通过查询已经索引好的网页全文信息,返回一些相关程度高的页面信息。
这个阶段主要的代表作:Alta Vista,Excite
网页链接分析阶段
这个阶段搜索引擎所使用的网站链接形式与当前基本相同。该阶段,外部链接表示推荐。因此,通过计算每个网站的推荐链接数量,就可以判断一个网站的流行性和重要性。
于是搜索引起通过结合网页内容的重要性和相似程度来改善搜索的信息质量。代表作:谷歌搜索
这种模式也是谷歌首创的,目前,网页链接分析算法以及器改进优化版本在主流的搜索引擎中大行其道。
用户意图识别阶段
这个阶段的搜索引擎以用户为中心作为设计的初心,搜索引擎力求理解每一位用户的真正搜索诉求,力求做到千人千面,追求个性化识别和反馈。
比如说两个人搜索小米可能分别实小米手机和谷物小米。
为了更好的识别以及满足用户的搜索需求,更多的技术也在不断引入:AI技术,地理位置信息技术,用户画像。。。
3 两大分类
站外搜索
就是全网搜索,现在主流的搜索引擎都是全网搜索,比如谷歌,百度,必应。
站内搜索
比如京东搜索自己站内的商品