今天一时兴起,想知道能否在Google和Baidu上搜到我的Blog,结果乘兴而去,败兴而归,什么也没有。那么网络搜索引擎是是怎么工作的呢?我的Blog怎样才能被Google检索呢?通过Google的搜索我找到了答案。
原来搜索引擎由机器人、索引器、数据库、检索器四部分组成。
所谓的“机器人”实际上是一个定期遍历所有网页的程序,机器人定期按照一定的规则对网站、网页以及网页中的所有链接进行遍历,然后将找到的网页交给索引器。
索引器对网页中的内容进行分析,主要是对关键词的分析,然后在关键词和网页之间建立索引并保存到大型数据库中。
检索器的工作是根据用户输入的关键词在数据库中进行检索,然后对检索的结果按照一定的算法进行排序,最后展现给用户。
所以搜索的实质是数据库的检索,而不是真正意义上的网络搜索。原理说起来简单,但实际的工作原理复杂的多,可以想象,单是关键词的识别就已经非常复杂了。
为什么对搜索网页的程序有“机器人”这样一个称呼呢?我想大概最初的网页搜索工作是人手工来完成的,后来有了程序来帮忙,就像现实生活中有机器人帮忙来做体力活一样,所以就有了“机器人”这个形象的称呼了。又因为这个机器人从一个网站爬到另一个网站,从一个网页爬到另一个网页,在网中爬来爬去,所以有的时候也被称作蜘蛛。
所以如果想自己的Blog尽快被Google检索,最好的办法就是尽可能多的为之建立链接,比如到各大论坛去贴上一个Blog的链接就可以了。