php关键词分词搜索 最多匹配的排在最前面_网络营销之SEO:搜索引擎的排名规则解读...

本文介绍了搜索引擎的排名规则,从搜索词处理(包括中文分词、去停止词、指令处理等)到关键词对文件的匹配,再到相关性计算(关键词常用程度、词频密度、位置形式、匹配距离等),最后讨论了排名显示、搜索缓存及日志的重要性。搜索引擎通过这些步骤,提供最相关和高质量的搜索结果。
摘要由CSDN通过智能技术生成

c6003b962a38cb1430a141485acf3d83.png

排名笼统意义上就是说搜索引擎在得到用户搜索之后,所占现在用户面前的位置。但是实际的情况是搜索引擎经过抓取页面,经过预处理的倒排索引后,再通过用户检索的好感,排名程序调用索引库,最后展现在用户面前的位置。

1.搜索词处理

(1)中文分词。与页面索引时一样,捜索词也必须进行中文分词,将査询字符为转 换为以词为基础的关键词组合。分词原理与页面分词相同。

(2)去停止词。和索引时一样,搜索引擎也需要把搜索词中的停止词去掉,最大限 度地提高排名相关性及效率。

(3)指令处理。对于搜索引擎来说,当我们进行输入一个词的时候,例如:“上海居住证”,搜索引擎会自动的将这两个词拆分为“上海”和“居住证”,并且默认为这两个关键词缺一不可,但是这也是搜索引擎理想中的状态,正常情况下,往往我们看到的都是半匹配状态。

另外用户输入的查询词还可能包含一些高级搜索指令,如加号、减号等,搜索引擎,都需要做出识别和相应处理。

(4)拼写错误矫正。用户如果输入了明显错误的字或英文单词拼错,搜索引擎提示用户正确的用字或拼法。

(5)整合搜索触发。某些搜索词会触发整合搜索,比如“小苹果”就经常触发图片和、视频、音乐等内容,当前的热

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值