通过浏览器提交给搜索引擎后,
搜索引擎就会返回跟用户输入的内容相关的信息列表。
其实,
搜索引擎涉及多领域的理论和
技术:数字图书馆、数据库、信息检索、信息提取、人工智能、机器学习、自然语言处理、
计算机语言学、统计数据分析、数据挖掘、计算机网络、分布式处理等,具有综合性和挑战
性。
工作原理
搜索引擎的基本上分为四个步骤:
1.
爬行和抓取
搜索引擎派出一个能够在网上发现新网页并抓文件的程序,这个程序通常称之为蜘蛛。
搜索引擎从已知的数据库出发,就像正常用户的浏览器一样访问这些网页并抓取文件。
搜索引擎会跟踪网页中的链接,
访问更多的网页,
这个过程就叫爬行。
这些新的网址会
被存入数据库等待抓取。
所以跟踪网页链接是搜索引擎蜘蛛发现新网址的最基本的方法,
所以反向链接成为搜索引擎优化的最基本因素之一。
搜索引擎抓取的页面文件与用户
浏览器得到的完全一样,抓取的文件存入数据库。
2.
索引
蜘蛛抓取的页面文件分解、
分析,
并以巨大表格的形式存入数据库,
这个过程既是索引
(
index).
在索引数据库中,网页文字内容,关键词出现的位置、字体、颜色、加粗、斜
体等相关信息都有相应记录。
3.
搜索词处理
用户在搜索引擎界面输入关键词,单击“搜索”
按钮后,搜索引擎程序即对搜索词进行
处理,
如中文特有的分词处理,
去除停止词,
判断是否需要启动整合搜索,
判断是否有
拼写错误或错别字等情况。搜索词的处理必须十分快速。
4.
排序
对搜索词处理后,
搜索引擎程序便开始工作,
从索引数据库中找出所有包含搜索词的网
页,
并且根据排名算法计算出哪些网页应该排在前面,
然后按照一定格式返回到
“搜索”
页面。
再好的搜索引擎也无法与人相比,这就是为什么网站要进行搜索引擎优化。
没有
SEO
的帮助,搜索引擎常常并不能正确的返回最相关、最权威、最有用的信息。
SEO
SEO
是由英文
Search Engine Optimization
缩写而来,中文意译为“搜索引擎优化”
。
SEO
是
指通过对网站内部调整优化及站外优化,
使网站满足搜索引擎收录排名需求,
在搜索引擎中
提高关键词排名,从而把精准用户带到网站,获得免费流量,产生直接销售或品牌推广。
SEO
优化
(
1
)
META
标签优化:例如:
TITLE
,
KEYWORDS
,
DESCRIPTION
等的优化
(
2
)内部链接的优化,包括相关性链接(
Tag
标签)
,锚文本链接,各导航链接,及图
片链接
(
3
)网站内容更新:每天保持站内的更新
(
主要是文章的更新等