easyui一个页面两个搜索框对应两张表_SEO从搜索引擎起开始

c52e22a95dd8515f22a7f9fdf69733b4.png

SEO常常停在耳边的话,具体是什么?能干什么?大多数人一脸懵逼。

我也是从一脸懵逼过来的,走了很多弯路,但结果还好。初登大雅之堂,希望大家能有收获。

谈到seo它就是告诉浏览器,快来把我家网站收录一下,顺便把它放在最亮眼的地方。只要用户想要我产品沾边的,直接蹦到它眼前。可是话又说回来,天上没有那么多的好事,虽然成年人的世界里全都要,但你不是superman,咱们还是一步一个脚印来。

搜索引擎工作过程

搜索引擎的工作的过程非常复杂,而简单的讲搜索引擎的工作过程大体可以分成三个阶段

  1. 爬行和抓取
  2. 预处理
  3. 排名

爬行和抓取

搜索引擎蜘蛛通过跟踪链接访问页面,获取页面 HTML 代码存入数据库。

两个方面:深度优先搜索和广度优先搜索

77a6a197889eec198ad27f9fd7bb4c0d.png

其实就是你新上了一个网站,它从你的域名下的二位维度去全面的展开的网站,并将信息收录到一个收录池里做预处理的备用,但要记住,尽量不要让你的路由超过4层,例如“http://www.zhihu.com/index/list/detail/children/..."。这个不被推崇,搜索引擎蜘蛛也是又脾气的。

预处理
预处理”也被简称为“索引”,因为索引是预处理最主要的步骤

60f1732404387ada715fa3a00715a895.png

它从这9个方面去处理和提纯你的网站,也就是生成关键字的过程。它们的各个含有如下:

  1. 提取文字:搜索引擎蜘蛛爬取了你的网站页面以后,它会提取你html中的文字,不仅是也面显示的,不显示的也会提取,就是你代码的除去标签的,只要都是你输入的它都会爬取下来。
  2. 中文分词:分词是中文搜索引擎特有的步骤。搜索引擎存储和处理页面及用户搜索都是以词为基础的。英文等语言单词与单词之间有空格分隔,搜索引擎索引程序可以直接把句子 划分为单词的集合。而中文词与词之间没有任何分隔符,一个句子中的所有字和词都是连在一起的。搜索引擎必须首先分辨哪几个字组成一个词,哪些字本身就是一 个词。比如“减肥方法”将被分词为“减肥”和“方法”两个词。不同的搜索引擎有不用的办法,大致上就分为两种:基于词典匹配和基于统计的分词方法。
  3. 去停止词:无论是英文还是中文,页面内容中都会有一些出现频率很 高,却对内容没有任何影响的词,如“的”、“地”、“得”之类的助词,“啊”、“哈”、“呀”之类的感叹词,“从而”、“以”、“却”之类的副词或介词。 这些词被称为停止词,因为它们对页面的主要意思没什么影响。英文中的常见停止词有 the,a,an,to,of 等。
  4. 消除噪声:绝大部分页面上还有一部分内容对页面主题也没有什么贡献,比如版权声明文字、导航条、广告等。搜索引擎需要识别并消除这些噪声,排名时不使用噪声内容。
  5. 去重:去重的基本方法是对页面特征关键词计算指纹,也就是说从页面主体内容中选取最有代表性的一部分关键词(经常是出现频率最高的关键 词),然后计算这些关键词的数字指纹。也是用来审核该文章或者页面的抄袭。
  6. 正向索引:正向索引也可以简称为索引。也就是关键词库的生成。它记录了每一个关键词在页面上的出现频率、出现次数、格式(如出现在标题标签、黑体、H 标签、锚文字等)、位置(如页 面第一段文字等)。
  7. 反向索引:正向索引还不能直接用于排名。假设用户搜索关键词 ,如果只存在正向索引,排名程序需要扫描所有索引库中的文件,找出包含关键词的文件,再进行相关性计算。这样的计算量无法满足实时返回排名结果的要求。所以搜索引擎会将正向索引数据库重新构造为倒排索引,把文件对应到关键词的映射转换为关键词到文件的映射。
  8. 链接关系计算:搜索引擎在抓取页面内容后,必须事前计算出:页 面上有哪些链接指向哪些其他页面,每个页面有哪些导入链接,链接使用了什么锚文字,这些复杂的链接指向关系形成了网站和页面的链接权重。
  9. 特殊文件处理:搜索引擎还不能处理图片、视频、Flash 这类非文字内容,也不能执行脚本和程序。对这一部分东西进行根据内容的处理。

排名

经过搜索引擎蜘蛛抓取的界面,搜索引擎程序 计算得到倒排索引后,收索引擎就准备好可以随时处理用户搜索了。用户在搜索框填入关键字后,排名程序调用索引库数据,计算排名显示给客户,排名过程是与客户直接互动的。

这就是浏览器对新网站的收录及它的关键字生成和排名的一个过程,也是SEO的关键,是对它的这个过程的优化,帮助网站拥有直接地位的着手点。敬请期待下期seo的征途开始。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值