kibana 查看索引库中文档个数_搜索引擎的工作原理

在学习SEO中,搜索引擎的工作原理是一节必学的课程,搞懂了搜索引擎的工作原理之后,可以解决优化当中很多问题,如网站网站蜘蛛有没有来网站,网站为什么没有收录,网站为什么有收录,没有排名

搜索引擎的工作原理非常简单,1、抓取 2、过滤 3、收录,4、排序(排名) 总共4个步骤,弄懂每个步骤里有什么既可

87b927a471c428e76881bb56488f5237.png
搜索引擎的工作原理图

1、抓取

搜索引擎为想要抓取互联网站的页面,不可能手动去完成,那么百度,google他们的工程师就编写了一个程序,他们给这个自动抓取的程序起了一个名字,蜘蛛(也可以叫做“机器人”)。由蜘蛛来发现网页,抓取网站

抓取完了之,把这些内容放在哪里呢?临时数据库

2、过滤

由于抓取来放到临时数据中的内容,有优质的内容,也有垃圾的内容或者重重复的内容,也有可能以前就已经存在搜索引擎中了,要是你,这些内容你还会要么?答案很定不会,所以这些内容都会被丢弃,过滤就是过滤掉那些质量不高的,垃圾的内容,如果你不想自己的内容被过滤掉,那就好好去做内容

3、收录

如果内容没有被过滤掉,那内容就会被收录了,打开百度搜索一条链接就可以查看到这条链接有没有收录

f504b465772593950d18b65bdaef239c.png
页面被收录了

ec40421e997f4490caeb365f6f2e96b8.png
页面没有收录

收录了,就可以获得排名么?基本上你可以这样认为,但其实收录之后是需要建立索引的,第一张图也没有给出收录,你看到的是临时数据直接到索引。当你的内容建立了索引,才有机会获得排名。所以这里要注意,由于单个的索引没有办法进行查询,只能从百度的站长平台看到整个网站的索引量

7a0790997d8aafab158d2eb4076f5f22.png
站长平台的索引量

收录:页面被Baiduspider发现、分析过

索引:Baiduspider经初步分析后认为有意义,做建库处理

00ffaa6daab95f4224406f4255c83105.png
收录和索引的关系

收录和索引的关系:包含关系,先收录才可以建索引,收录量大于索引量。

参考资料:一张图看懂收录与索引的区别:http://zhanzhang.baidu.com/college/articleinfo?id=806

4、排序

用户输入的关键词,就可以查看到相关的内容了。这个时候,就会一条一条的展示,那谁排在第一,谁排在第二,我们把这种结果的排序,称为排名。

f5b9fc356169358f46c4e20cd344854a.png

排名会是很复杂的,百度会对其进行一系列复杂的分析,并根据分析的结论在索引库中寻找与之最为匹配的一系列网页,按照用户输入的关键词所体现的需求强弱和网页的优劣进行打分,并按照最终的分数进行排列,展现给用户。

要非常熟悉搜索引擎的工作原理才行,因为只有懂得了这个才能弄明白问题的产生的原因

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值