面试:正排索引与倒排索引

一、正排索引

搜索引擎是个软件,他是看不懂网页的内容的,他看到的一个网页就是一堆的词。

可以这样看:

网页A=关键词1+关键词2+关键词3+关键词4+关键词5+关键词6+关键词7+.......

网页B=关键词2+关键词5+关键词+关键词12+关键词56+关键词36+关键词99+.....

网页C=关键词1+关键词3+关键词6+关键词9+关键词55+关键词65+关键词98+.....

 

大概网页在搜索引擎眼里就有是这样一堆东西,具体怎么分词,这个是一个很有意思的东西,我自己在处理大批量关键词的时候也经常卡在这个分词上,不过没办法,我们没有那么大量的词库,也没有大数据来做匹配,当然了,我们一般也用不了那么多的词,有一部分就行了。

其实刚刚这个网页被分成一个个关键词的过程就是一个正排索引的过程,当所有的网页都被分成这样的文件的时候,正排索引的过程就算结束了。

 

二、倒排索引

再说倒排索引之前,要说一下搜索引擎为用户要提供什么样的服务来满足用户的需求。

搜索引擎也是一个大型的网络应用软件,他的出现必然是要满足用户的,他要满足的就是用户的检索需求,就是用户在关键词搜索框里面输入一个关键词的时候,他能够快速的返回给用户一个搜索结果。

这个就是现在我们看到的界面,也就是搜索结果页面。

看看这个:

110441_TL77_2009816.png

这个页面就是我搜索“原创文章代写”这个关键词出现的页面。

他的实质是什么?

就是:原创文章代写这个关键词后面跟了一堆的网页。

 

用最开始正排索引的公式来表达一下就是:

关键词1=网页A+网页B+网页C+网页O+....

关键词2=网页B+网页P+网页Z+......

关键词3=网页D+网页T+网页Y+网页Z+.....

这个过程就是倒排索引的过程,就是用每个网页中的关键词来给网页进行建立另外一个索引库。

 

倒排索引之后,就是排序过程了,也就是说关键词1后面跟了ABCD....一堆网页,那么哪个网页更重要呢?哪个网页应该排在前面呢?

这个点就是我们最大众的SEO要研究的一个点了。

 

今天先聊到这里相信大家应该能够大概的了解正排索引和倒排索引了。

 

我的QQ号:253280463,欢迎与您共同交流SEO相关的问题,如果您觉得这篇文章对您有价值,请在转载的时候写明出处,邻村小五谢谢您!

 

SEO实操小组招募,百分百学会做排名,如果不会,加价退款,详情点击了解

 

本文:【正排索引和倒排索引】--SEO基础 
文章地址:http://zhengzhou.seosrx.net/jichu/24.html 转载请保留链接地址

转载于:https://my.oschina.net/u/2009816/blog/746141

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值