网站SEO 第四部分:SEO 指导下的技术支持

转载:http://www.linkcn.net/wangluotuiguang/200806/02-121.html

第四部分:SEO 指导下的技术支持
对搜索引擎最友好(Search Engine Friendly)的网页是静态网页,但大部分内容丰富或互动型网站都不可避免采用到相关技术语言来实现内容管理和交互功能。SEO 思想指导下的技术支持,主要是对特定代码的优化和对动态网页进行静态处理的措施。

4.1. Title 和 Meta 标签

以.html 或.htm 为扩展名的 HTML 文档称为静态网页。Meta 称为元标志,用于网页的<head >与</head>中。Meta 标签的用处很多,目前几乎所有的搜索引擎机器人都通过自动查找Meta 值来给网页分类,是籍此判断网页内容的基础。其中最重要的是 description(网站描
述)和 keywords(网站关键词)。另外一个基本的属性是 Title 标签,提示搜索引擎关于本页的主题。Meta 和 Title 的形式在 html 语言中体现为:
<head>
<title>title 标题</title>
<meta name="keywords" content="网页描述">
<meta name="description" content="关键词">
......
</head>
尽管 Meta 本身不足以解决排名问题,但对 Meta 标签的书写仍然是搜索引擎优化的基础工作。
清晰准确的 Meta 文字与正文内容的关键词相呼应,是排名加分的重要条件之一。

4.1.1. 标题(Title)

网页优化可以说是从 Title 开始的。在搜索结果中,每个抓取内容的第一行显示的文字就是该页的 Title,同样在浏览器中打开一个页面,地址栏上方显示的也是该页的 Title。因此,Title 可谓一个页面的核心。对 Title 的书写要注意以下问题:
1、title 简短精炼,高度概括,含有关键词,而不是只有一个公司名。但关键词不宜过多,
不要超过 3 个词组。企业网站的 title 通常以公司名+关键词为内容
2、前几个词对搜索引擎最重要,因此关键词位置尽量靠前。
3、最好将 title 组织成符合语法结构和阅读习惯的短句或短语,避免无意义的词组罗列式title

4.1.2. 关键词(Keywords)
Keywords 提示搜索引擎:本网站内容围绕这些词汇展开。因此 keywords 书写的关键是每个词都能在内容中找到相应的匹配才有利于排名。Meta 中的关键词书写技巧见前文的“关键词策略”。

4.1.3. 描述(Description)
描述部分用简短的句子告诉搜索引擎和访问者关于本网页的主要内容。用该网站的核心关键 词搜索后得到的搜索结果中,描述往往显示为标题后的几行描述文字。Description 一般被
《搜索引擎优化 SEO 知识完全手册》第18 页 胡宝介:www.sem123.com(个人主页)www.impics.com 1、 描述中出现关键词,与正文内容相关
2、 同样遵循简短原则,字符数含空格在内不要超过 200 个字符
3、 补充在 title 和 keywords 中未能充分表述的说明

4.1.4. 其它 Meta 标签
为了限制搜索引擎对内容的抓取,可以采用以下几个 Robots Meta 标签:

<meta name="Robots" content="all|none|index|noindex|follow|nofollow">
其中:all:文件将被检索,且页面上的链接可以被查询; none:文件将不被检索,且页面
上的链接不可以被查询;index:文件将被检索;follow:页面上的链接可以被查询;noindex:
文件将不被检索,但页面上的链接可以被查询;nofollow:文件将不被检索,页面上的链接
可以被查询。
但并不是所有的搜索引擎都支持 meta 中的 robots 标签,但是所有搜索引擎都支持一个功能
更强的 robots.txt 的文本文件来达到上述功能(关于 robots.txt 文件应用的介绍,E 书专
家平文胜曾专门撰文详细解说“robots.txt 和 Robots META 标签”)。其它常用 meta 标签还
有:
<META name author> 网站作者
<META name classification> 网站所属目录类别
<META name copyright> 版权声明
<META name generator> 网站用什么软件做的
……
首页、重要的内页的 title 和 meta 标签最好分别书写,针对栏目主题体现不同的内容。

4.2. 动态网页优化
动态网站是指网站内容的更新和维护是通过一个带有数据库后台的软件,即内容管理系统

(CMS)完成。一般采用 ASP,PHP,Cold Fusion,CGI 等程序动态生成页面。动态页面在网络
空间中实际并不存在,它们的大部分内容通常来自与网站相连的数据库,只有接到用户的请
求,在变量区中输入一个值以后才会生成。动态网页扩展名显示为.asp、.php、cfm 或.cgi,
而不是静态网页的.html 或者.htm。其 URL 中通常出现“?”、“=”、“%”,以及“&”、“$”等
符号。网站使用动态技术的好处,除了增加网站交互功能,还具有容易维护和更新的优点,
因此为许多大中型网站采用。
但大多数搜索引擎的蜘蛛程序都无法解读符号“?”后的字符。这就意味着动态网页很难被
搜索引擎检索到,因而被用户找到的机会也大为降低。因此,建设网站之前首先要端正思想,
即能够采用静态表现的网页尽量不要用动态实现,重要的网页用静态表现。同时使用技术将
动态网页转化成静态网页形式,使 URL 中不再包含“?”“=”等类似的符号。也可以通过对
网站进行一些改动,间接增加动态网页的搜索引擎可见度。即坚持“动静结合,以静制动”
的原则。
不同技术的解决方案:
针对不同程序开发的动态网页有着相应的解决方案。以下是作者 Karen 编译的部分内容:

4.2.1. CGI/ Perl
如果你在网站中使用的是 CGI 或者 Perl,可用一个脚本拾取环境变量前的所有字符,再将

URL 中剩余的字符赋值给一个变量。这样,你就可以在 URL 中使用该变量了。不过,对于那些内置了部分 SSI(Server-Side Include:服务器端嵌入)内容的网页,主要的搜索引擎都能够提供索引支持。那些以.shtml 为后缀名的网页也被解析成 SSI 文件,相当于通常的.html 文件。但如果这些网页在其 URL 中使用的是 cgi-bin 路径,则仍有可能不被搜索引擎索引。

4.2.2. ASP
ASP(Active Server Pages: Web 服务器端动态网页开发技术)被用于基于微软的网络服务器

中。使用 ASP 开发的网页,一般后缀名为.asp。只要避免在 URL 中使用符号“?”,大多数搜
索引擎都能够支持用 ASP 开发的动态网页。

4.2.3. Cold Fusion
如果你使用的是 Cold Fusion,那么你就需要在你的服务器端重新对其进行配置,使其能够

将一个环境变量中的符号“?”用符号“/”代替,并将替换后的数值传给 URL。这样一来,
最后到达浏览器端的就是一个静态的 URL 页。当搜索引擎对该转换后的文件进行检索时,它
不会遭遇“?”,因而可继续对整个动态页的索引,从而使你的动态网页对搜索引擎仍然具有
可读性。

4.2.4. Apache 服务器
Apache 是最流行的 HTTP 服务器软件之一。它有一个叫做 mod_rewrite 的重写模块,即 URL

重写转向功能。该模块能够使你将包含环境变量的 URL 转换为能够为搜索引擎支持的 URL
类型。对于那些发布后无须多少更新的网页内容如新闻,可采用该重写转向功能。

4.2.5. 建立静态入口
在“静动结合,以静制动”的原则指导下,还可以通过对网站做一些修改,尽可能增加动态

网页的搜索引擎可见度。如将动态网页编入静态主页或网站地图的一个链接中,以静态目录
的方式呈现该动页面。或者为动态页面建立一个专门的静态入口页面(gateway/entry),链
接到动态页面,然后将静态入口页面递交给搜索引擎。
对一些重要的、内容相对固定的页面制作为静态网页,如包含有丰富关键词的网站介绍、用
户帮助,以及含有重要页面链接的网站地图等。网站首页尽量全部采用静态形式,并将重要
动态内容以文本链接方式全部呈现,虽然增加了维护工作量,但从 SEO 的角度看是值得的。
也可以考虑为你的重要动态内容创建静态的镜象网站。

4.2.6. 付费登录搜索引擎
当然,对于整个网站都采用与数据库相连的内容管理系统(CMS)发布的动态网站而言,提

高搜索引擎可见度的最直接办法就是进行付费登录,直接提交动态网页到搜索引擎目录,或
做关键字广告,保证网站被搜索引擎收录。

4.2.7. 搜索引擎对动态网站支持的改进
搜索引擎一直在提高自己对于动态页面的支持。到目前为止,GOOGLE、HOTBOT 和百度等开

始尝试抓取动态网站页面(甚至包括 URL 带 "?"的页面)。但这些搜索引擎抓取动态页面时,
为了避免"搜索机器人陷阱"(spider traps,脚本错误,这种错误会让搜索机器人进行无限
循环的抓取,无法退出)",都只抓取从静态页面链接过去的动态页面,而从动态页面链出
去的动态页面都不再抓取,即不会对动态页面中的链接进行深入访问。
对于直接使用动态的 URL 地址,请注意:
•文件 URL 中不要有 Session Id,同时不要用 ID 作为参数名称(特别是对于 GOOGLE);
如 :《 网 络 营 销 基 础 与 实 践 》一书 , 在当当网的介绍页面URL地址是 :
http://www.dangdang.com/product_detail/product_detail.asp?product_id=493698,该
页就无法被读取。
•参数越少越好,尽量不要超过 2 个;
•尽量不要在 URL 中使用参数,这样可以增加动态页面被抓取的深度和数量。
附:Google 向网站管理员提供的信息:www.google.com/webmasters/guidelines.html
百度常见站长问题:http://www.baidu.com/search/guide.html#2

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值