搜索引擎工作原理

最新推荐文章于 2023-05-02 15:24:16 发布

lzz360

最新推荐文章于 2023-05-02 15:24:16 发布

阅读量1.8k

点赞数 3

分类专栏： SEO 文章标签：索引搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lzz360/article/details/11825643

版权

SEO 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

搜索引擎工作原理：爬行和抓取------>预处理------>排名

爬行和抓取:

1，是通过蛛蛛程序来实现的,蛛蛛主要是通过链接来抓取所有页面的.

所以要想让蛛蛛尽量的抓取页面，必须要吸引蛛蛛（网站优化）。

2，为了避免重复爬行和抓取网址，搜索引擎建立了一个地址库用来保存已经抓取的页面

地址库中的url 大多数是蛛蛛获取到的，当然也有一些是通过提交网址的

（不过这样可能没什么用因为蛛蛛不抓取的，说明权重比较低）

3，文件存储，每个url 都有对应的文件id,该文件用于保存抓取到的内容

预处理:

1,提取文字，(html格式标签，js 这些是没法用于排名的内容的)

2，中文分词，有两种方法一种是基于词典匹配的，另一种是基于统计的（一般两种都是结合着用的）

比如：高效减肥，词典匹配高效减肥都可以，统计匹配就高效减肥

3，去停止词: 什么的了地啊哈这些搜索引擎在索引页面的时候是会去掉的

4，消除噪声：那些无关紧要的内容（排名是不会使用噪声内容的）

5，去重：搜索引擎很不喜欢同样的内容出现在两个不同的网站上

6，索引：经过上面的步骤后，搜索引擎程序就可以提取关键词了，按照分词程序分好的词

把页面转换为一个关键词组成的集合，同时记录每个关键词在页面上的出现频率，密度等

排名:

1 指令处理：查询词完成分词后，搜索引擎的默认处理方式是在关键词之间先使用“与”逻辑后使用“或”。

比如用户输入“减肥方法” 程序分为”减肥“和“方法”和“减肥方法”，那么有包含这两种的就优先匹配，其次在匹配单个的

2 相关性计算

词频及密度，关键词的位置及形式（title h1 黑体等）关键词距离（减肥和方法不要写的太远了，距离越近搜索引擎会认为关系更大的）

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
搜索引擎工作原理

搜索引擎工作原理：爬行和抓取------>预处理------>排名爬行和抓取:1，是通过蛛蛛程序来实现的,蛛蛛主要是通过链接来抓取所有页面的.所以要想让蛛蛛尽量的抓取页面，必须要吸引蛛蛛（网站优化）。2，为了避免重复爬行和抓取网址，搜索引擎建立了一个地址库用来保存已经抓取的页面地址库中的url 大多数是蛛蛛获取到的，当然也有一些是通过提交网址的（不过这样可能没什么用因
复制链接

扫一扫

专栏目录

lzz360 CSDN认证博客专家 CSDN认证企业博客

码龄12年

94: 原创

18万+: 周排名

173万+: 总排名

44万+: 访问

: 等级

4494: 积分

54: 粉丝

88: 获赞

30: 评论

84: 收藏

私信

关注

热门文章

分类专栏

php 49篇
javaWeb(Struct2) 6篇
javaWeb(hibernate) 9篇
javaWeb(spring) 2篇
c# 4篇
android 4篇
uml 1篇
设计模式 2篇
网站前端 17篇
SEO 2篇
数据库 3篇
Asp.net 3篇
AJAX 4篇
Linux 32篇
c&c++ 1篇
nosql 1篇
R 5篇
大数据 10篇
docker 2篇
python 2篇

最新评论

类图顺序图活动图状态图用法和比较
青春依旧_: 我倒觉得先顺序图，后类图。顺序图会强迫你用类似mvc的模式思考（边界、控制、实体），基于该视角分解下得到系统交互中可能的类，通过交互传递的消息与箭头等抽出函数与属性，最终得到类图
类图顺序图活动图状态图用法和比较
熊猫队长-: 角度新颖
如何进行路由器的端口映射让外网可以访问内网的机器
mango_ling: 您好，我想问下公网的IP地址是电信公司分配得是动态的，这样也可以外网也可以访问吗。而且浏览器获得的公网IP地址跟路由器的公网IP不同的。
Asp.net MVC4 使用EF实现数据库的增删改查
LPcomeon: 特别感谢博主！！！谢谢谢谢谢谢我刚开始自学 MVC+EF //1,将实体对象加入EF对象容器中，并获取伪包装类对象 DbEntityEntry<Customer> entry = db.Entry<Customer>(model); //2,将伪包装类对象的状态设置为unchanged entry.State = System.Data.EntityState.Unchanged; 这两句代码我出现的问题我说下写上DbEntityEntry 报红说我缺少using 就using System.Data.Entity.Infrastructure;就好了这时EntityState报红了我就在Data和EntityState之间加了个Entity （entry.State = System.Data.Entity.EntityState.Unchanged;）就好了 ^_^ 不知道大家遇到这个问题没有再次谢谢博主(#^.^#)
Asp.net MVC4 使用EF实现数据库的增删改查
你猜我猜你猜我猜不猜啊i: 非常好，刚好目前在学习mvc

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。