URL网址规范化

原创 2007年10月04日 12:30:00
网址URL规范化(URL canonicalization)是近一年来在Google搜索结果中出现的一个很大的问题。它指的是搜索引擎挑选最好的URL网址作为真正网址的过程。

举例来说,下面这几个URL一般来说指的是同一个文件或网页:

http://www.domainname.com
http://domainname.com
http://www.domainname.com/index.html
http://domainname.com/index.html

但是从技术上来讲,这几个URL网址都是不同的。虽然在绝大部分情况下,这些网址所返回的都是相同的文件,也就是你的主页。但是从技术上来说,主机完全可以对这几个网址返回不同的内容。

当搜索引擎要规范化网址时,搜索引擎需要从这些选择当中挑一个最好的代表。一般来说,你的主页应该是固定的,只有一个。但是有的时候,在很多网站上站长在链接回主页时,所使用的URL并不是唯一的。很可能在你的网站上,一会连到URL http://www.domainname.com,一会儿连到URL http://www.domainname.com/index.html

虽然这不会给访客造成什么麻烦,因为这些网址都是同一个文件,但是对Google来说却是造成了困惑,哪一个网址是你真正的主页呢?如果在你的网站上,不同的版本网址都大量出现,那么这两个URL可能都会被Google收录进数据库,这时就会造成复制内容网页。

所谓复制内容网页,指的是两个或多个网页的内容是相同或大部分相似的。很多时候,复制网页有可能是作弊手段。就算不是作弊手段的时候,搜索引擎通常也只会挑出其中一个返回搜索结果,而把其他的复制网页都排在最后面,以至于根本找不到。

当你的网站出现网址URL规范化问题的时候,就有可能造成被怀疑为复制网页,因而影响搜索引擎结果排名。

从站长的角度来考虑,你应该做两件事:

1)你的网站内部在链接到其他网页,尤其是主页时,只使用一种URL。不管是包含www或不包含www,你要由始至终只使用一个版本。这样搜索引擎也就明白哪一个是规范化的主页网址。

2)但是你没办法控制别的网站用哪一个网址连向你的主页。所以你应该在你的主机服务器上,把所有有可能成为主页网址的URL,做301重定向到你所选择的主页网址版本。也就是说,从下面这几个网址

http://domainname.com
http://www.domainname.com/index.html
http://domainname.com/index.html

都要做301重定向到这个网址

http://www.domainname.com

很重要的一点是,如果你的网站出现了URL规范化的问题,千万不能使用Google的网址删除反馈表,来要求删除其中的一个网址版本。比如说,你所要的是带有www的版本

http://www.domainname.com

你千万不能到Google的网站上填表,要求没有www的主页网址

http://domainname.com

被删除掉。因为那样做的话,你整个的域名有可能被删除6个月。

当然,除了包含www和不包含www的两个版本以外,还有其他类型的URL规范化问题。比如有的时候,搜索引擎会去掉或加上网址尾端最后的斜线。有 的时候会尝试把大写字母换成小写字母,有的时候可能尝试去掉会话ID(session ID)等等,这些都有可能造成网址规范化问题。

原创:Zac 地址:


网址URL规范化(URL canonicalization)是近一年来在Google搜索结果中出现的一个很大的问题。它指的是搜索引擎挑选最好的URL网址作为真正网址的过程。

举例来说,下面这几个URL一般来说指的是同一个文件或网页:

http://www.domainname.com
http://domainname.com
http://www.domainname.com/index.html
http://domainname.com/index.html

但是从技术上来讲,这几个URL网址都是不同的。虽然在绝大部分情况下,这些网址所返回的都是相同的文件,也就是你的主页。但是从技术上来说,主机完全可以对这几个网址返回不同的内容。

当搜索引擎要规范化网址时,搜索引擎需要从这些选择当中挑一个最好的代表。一般来说,你的主页应该是固定的,只有一个。但是有的时候,在很多网站上站长在链接回主页时,所使用的URL并不是唯一的。很可能在你的网站上,一会连到URL http://www.domainname.com,一会儿连到URL http://www.domainname.com/index.html

虽然这不会给访客造成什么麻烦,因为这些网址都是同一个文件,但是对Google来说却是造成了困惑,哪一个网址是你真正的主页呢?如果在你的网站上,不同的版本网址都大量出现,那么这两个URL可能都会被Google收录进数据库,这时就会造成复制内容网页。

所谓复制内容网页,指的是两个或多个网页的内容是相同或大部分相似的。很多时候,复制网页有可能是作弊手段。就算不是作弊手段的时候,搜索引擎通常也只会挑出其中一个返回搜索结果,而把其他的复制网页都排在最后面,以至于根本找不到。

当你的网站出现网址URL规范化问题的时候,就有可能造成被怀疑为复制网页,因而影响搜索引擎结果排名。

从站长的角度来考虑,你应该做两件事:

1)你的网站内部在链接到其他网页,尤其是主页时,只使用一种URL。不管是包含www或不包含www,你要由始至终只使用一个版本。这样搜索引擎也就明白哪一个是规范化的主页网址。

2)但是你没办法控制别的网站用哪一个网址连向你的主页。所以你应该在你的主机服务器上,把所有有可能成为主页网址的URL,做301重定向到你所选择的主页网址版本。也就是说,从下面这几个网址

http://domainname.com
http://www.domainname.com/index.html
http://domainname.com/index.html

都要做301重定向到这个网址

http://www.domainname.com

很重要的一点是,如果你的网站出现了URL规范化的问题,千万不能使用Google的网址删除反馈表,来要求删除其中的一个网址版本。比如说,你所要的是带有www的版本

http://www.domainname.com

你千万不能到Google的网站上填表,要求没有www的主页网址

http://domainname.com

被删除掉。因为那样做的话,你整个的域名有可能被删除6个月。

当然,除了包含www和不包含www的两个版本以外,还有其他类型的URL规范化问题。比如有的时候,搜索引擎会去掉或加上网址尾端最后的斜线。有 的时候会尝试把大写字母换成小写字母,有的时候可能尝试去掉会话ID(session ID)等等,这些都有可能造成网址规范化问题。

 

URL网址规范化方法

转自:http://farlee.info/archives/url-canonicalization-method.html 什么是网址 url 规范化(URL canonicalizatio...

网址规范化(URL canonicalization)

搜索引擎会自动挑选最合适的URL做为一个网站的网址。众所周知,我们打开IE在地址栏里输入网址,根据各人用户体验的习惯不同,输入的方式也不同。这就是会出现不规范的网址的原因。 标签:网址规范 ...
  • acuna1
  • acuna1
  • 2013年06月09日 15:04
  • 865

在IIS7下做网址规范化

做SEO,避免不了301规范化URL,Apache下规范化首页URL最简单,但WIndows下实施会有一定的难度。 但在IIS7下比较方便 1.安装一下rewrite_2.0_rtw_x86.ms...

301重定向方法大全及SEO中网址规范化

现在大多数网站都存在一些内容相同但网址(URL)不一样的重复内容,这些重复的内容对于搜索引擎来说却可能被认为是复制网页,复制网页虽然不会被惩罚但因多个网址存在分散了页面权重,肯定不利于其排名。解决这个...
  • jy5212
  • jy5212
  • 2011年07月25日 14:32
  • 881

邮件网址url去重复软件

  • 2014年03月14日 15:12
  • 1.04MB
  • 下载

正则表达式匹配URL或者网址

正则表达式 (http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?...

利用js验证网址url

  • 2013年09月21日 17:01
  • 16KB
  • 下载

使用JS准确获取URL网址中参数的几种方法

(新年第一天上班)今天就遇到这样一个问题,简单描述就是需要从URL中获取所传递的参数。如果使用后台语言我们都会有很多中方法来获取,但是网站的中的所有数据都是通过AJAX进行传递的,所以需要使用JS进行...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:URL网址规范化
举报原因:
原因补充:

(最多只允许输入30个字)