完整的 Canonical 标签指南

什么是 SEO 中的规范标签?

让我们从规范标签定义开始。

规范标签是一种用于在 Google 搜索结果中重复或非常相似的页面中识别页面首选版本的方法。换句话说,搜索引擎依靠规范标签来确定要优先考虑哪个版本的 URL。

规范标签在防止从多个 URL 访问相同内容时可能出现的重复内容问题方面发挥着至关重要的作用。

什么是规范 URL?

既然您已经清楚地了解了规范标签 SEO 的含义,您可能有以下问题:什么是规范 URL?它与 canonical 标签有何不同?

答案如下:

== Google 将规范 URL 定义为(由 Google)选择的页面的 URL,该页面在一组重复页面中最具权威性。简而言之,Google 将规范 URL 识别为显示重复或类似内容的所有其他页面的 “主” 版本。==

如何指定规范 URL

当一个网站包含多个内容相同或非常相似的页面时,搜索引擎可能难以决定在 SERP 中显示哪个页面。为了解决这个问题,网站所有者可以指定一个规范链接元素,表明他们的首选显示页面。

在技术 SEO 中,有几种方法可以指定主页面(带和不带规范标记),其中许多方法在 Google 文档中有更详细的介绍。在这里,我们将介绍指定 canonicals 的最常用方法。

HTML 的 内的标记

如果你想为页面指定规范 URL,一种常见的方法是在其 HTML 代码的 部分包含一个规范标签,如 。这种简单的方法是使用最广泛的,它告诉搜索引擎当用户输入它所针对的查询时,应该索引并显示您的网页的哪个版本。

例如,如果您网站上的两个页面包含相同的内容,但具有不同的 URL,则添加带有 rel canonical 的代码行可以指示它是首选显示的页面。看看这个规范标签示例:

<head>

   <link rel="canonical" href="https://www.example.com/preferred-page.html">

</head>

规范 HTTP 响应标头

对于根据用户输入或其他变量显示动态页面的网站,在 HTTP 响应标头中添加规范 URL 是一种有效的方法。在这种情况下,规范标签可以引导搜索引擎爬虫,从而确保您想要的网页版本被索引。例如,您可以通过以下方式在 HTTP 标头中添加 canonical:

Link: <https://www.example.com/preferred-page.html>; rel="canonical"

XML 站点地图

指定网页规范版本的另一种方法是将其包含在您网站的 XML 站点地图中。这允许您与搜索引擎通信,应该为用户的查询索引哪个 URL。

虽然 Google 将所有站点地图条目都视为建议的规范,但这并不是一个明确的信号。搜索机器人仍可能分析内容和用户信号,以确定与特定搜索查询最相关的版本。但是,在站点地图中添加规范对于具有许多页面的大型或复杂网站特别有益。

绝对 URL

Google 建议在设置规范 URL 时使用绝对 URL 而不是相对 URL。绝对 URL 包括完整的 Web 地址,以协议(HTTP 或 HTTPS)开头,以特定页面或帖子结尾。这有助于搜索引擎了解您的内容版本是原始版本,并且应该在 SERP 中优先考虑。

Google 如何选择规范网址

影响 Google 选择规范 URL 的确切因素及其权重尚未完全披露。然而,在最近的 Search Off the Record 播客中,来自 Google 的 “Dups” 团队的 Allan Scott 阐明了搜索引擎如何处理重复内容。

据报道,谷歌评估了大约 40 个不同的信号,以确定哪个 URL 应该作为重复页面中的主要或规范版本。

Scott 指出,当强信号(例如 rel=“canonical” 标签或 301 重定向)相互冲突时,Google 的系统可能会依靠较弱的信号来做出决定。

这表明,虽然实施强大的规范化技术至关重要,但这些信号的不一致可能会导致 Google 依赖不太明确的标准。

以下是 Google 算法在确定规范 URL 时被认为会考虑的一些关键因素:

  1. 指向页面的链接: 为了评估页面的相关性和重要性,Google 会检查指向这两个页面的任何内部和外部链接,并选择链接更多、质量更好的页面。

  2. 规范设置(标签、响应标头、站点地图): 在确定页面的主要版本时,Google 会考虑其 HTML 代码中是否嵌入了规范标签、rel=“canonical” HTTP 标头以及其他提示,例如站点地图上列出的 URL。

Google 在选择规范 URL 时考虑的其他因素包括:

  1. HTTPS 页面: Google 会优先考虑 HTTPS 网页,而不是 HTTP 网页,但以下会产生冲突的情况除外:

    • 安全页面上存在无效的 SSL 证书。
    • 受保护页面中包含不安全的依赖项(除了图像)。
    • 用户通过其受保护的网页重定向到或不受保护的网页。
    • 安全网页有一个rel=“canonical”链接,指向其不安全的版本。
  2. Hreflang 集群: 为了确保网站的本地化工作取得成功,Google 建议将带有 hreflang 标签的 URL 分组到集群中进行规范化。

  3. 移动友好性: 要确保正确索引页面的规范版本,请包含一个 rel=“alternate” 链接元素,如果该页面存在于单独的 URL 上,则该链接元素会引用该页面的移动版本。

如您所见,Google 利用各种信号来决定应该选择哪些 URL 作为规范 URL。通常,如果 canonical 标签可用,它会使用它,但并非总是如此。如果 Google 认为另一个页面更能满足用户偏好或提供更准确的信息,它偶尔可能会选择非规范选项。

如何找出 Google 认为是规范的页面

尽管页面 HTML 代码中的 rel=“canonical” 元素可以让 Google 知道哪个版本必须是规范的,但 Google 可以忽略它并选择非规范页面。

不过别担心!有几种简单的方法可以确定 Google 将哪个页面视为规范页面,包括:

  • 使用 Google Search Console
  • 使用 SE Ranking 的 Rank Tracker

让我们更详细地回顾一下有关如何发现 Google 选择的规范的两个选项。

使用 Google Search Console

如果您已经在 GSC 中验证了您网站的所有权,请使用 Google Search Console 的页面索引报告来确定搜索引擎的首选页面。

此报告提供了所有已编入索引和未编入索引的网站页面的列表,允许您识别与备用规范标签的任何差异或缺少用户选择的规范标签的重复内容。如果您看到任何没有用户选择的 canonical 的页面,您可以通过在网页上包含 canonical 标签来解决此问题。

效果报告概述了您的网站在搜索结果中的效果,包括每个网页上的点击次数和展示次数。如果您注意到您的非规范 URL 在最近的一段时间内吸引了注意力并获得了展示次数,则可能表明 Google 无视您的规范标签。当您的规范标签设置正确时,甚至会发生这种情况。例如,有时非规范页面在没有任何明确原因的情况下会收到更多的外链或内部链接。

最重要的是,Google Search Console 的 URL 检查工具提供有关您网站上任何页面的索引和抓取状态的实时更新。使用此功能,您可以轻松识别和解决蚕食问题以及与索引相关的问题以及与特定 URL 相关的其他问题。

使用 SE Ranking 的 Rank Tracker

借助 SE Ranking 的排名跟踪工具,您可以在 Google 最关注的页面上获取信息。通过转到 Detailed report 并将鼠标悬停在关键字旁边的 URL 上来检查这一点。

  • 右侧的数字表示有多少页面正在竞争特定关键词。
  • 蓝色图标表示在 SERP 上成功找到了给定关键字的 URL。
  • 灰色图标表示在 SERP 上找不到给定关键字的 URL。
  • 红色图标表示网站的实际 URL 与您为关键字设置的目标 URL 不匹配。

为什么规范标签对 SEO 很重要?

规范标签为 SEO 提供了几个主要好处。以下是它们如何提高您网站的性能的详细介绍:

节省抓取预算

搜索引擎用于抓取和索引网站的预算有限。如果你在不同的 URL 上有相同内容的多个版本,搜索引擎可能会浪费资源来索引所有版本。规范标签通过指定首选版本来帮助您避免这种情况,以便搜索引擎可以专注于抓取和索引最有价值的页面。

防止出现重复内容问题

重复的内容会使搜索引擎感到困惑,并使它们难以确定要对哪个版本的内容进行排名。这可能会导致排名降低和错失流量机会。通过使用规范标签,您可以清楚地告诉搜索引擎哪个页面是原始的和最有价值的。

通过整合链接资产来提高搜索排名

来自其他网站的链接是搜索引擎的主要排名因素。当你有多个内容相似的页面时,这些链接的链接价值(排名能力)会被划分。规范标签允许您将此链接资产合并到首选 URL,这可能会在 SERP 中带来更高的排名。

避免与重复内容相关的处罚

在某些情况下,搜索引擎可能会惩罚具有大量重复内容的网站。通过正确实施规范标签,您可以避免这些处罚,并确保您的网站在搜索引擎中保持良好信誉。

我们什么时候应该将 canonical 标签用于 SEO 目的?

规范化可以最大限度地提高网站性能,并可以帮助您避免对 SEO 产生负面影响的重复内容问题。遵循本节中提供的建议可以帮助 Google 以正确的方式将您的内容编入索引。

分面导航

虽然分面导航(基于各种属性的产品排序和过滤)在用户体验方面带来了很多好处,但对于 SEO 来说,这可能是一个相当大的问题。

假设您的潜在客户想购买 10 码的黑色牛仔裤。他们需要做的就是按这些属性过滤您的目录,只需单击几下,他们就可以找到他们感兴趣的服装项目。

以下是此产品的链接可能的外观:

https://yourwebsite.com/women-jeans/black/size=10

但是,如果他们先选择大小筛选,然后再选择颜色,则同一项目的 URL 将如下所示:

https://yourwebsite.com/women-jeans/size=10/black

这同样适用于网站中可用的排序选项。

为了更好地理解规范标签和具有不同排序选项的 URL 之间的联系,我们以 eBay 上的笔记本电脑类别为例,其中包含用于工作的笔记本电脑,并针对此关键字集群进行了优化:https://www.ebay.com/b/Workstation-Laptops-Netbooks/175672/bn_7116632031?_dmd=2&mag=1&rt=nc

此页面的 canonical 标签如下所示:

<link rel="canonical" 
href="https://www.ebay.com/b/Workstation-Laptops-Netbooks/175672/bn_7116632031" /> 

如您所见,该页面正在引用自身。

此页面提供的导航功能包括:

现在,您只能想象可以为同一产品创建多少种不同的 URL 变体(参数化 URL)。从搜索引擎的角度来看,所有带有新参数的变体都是唯一的页面。

一些 SEO 使用 noindex 标签或 robots.txt 指令来解决这个问题,尽管使用规范标签通常是更好的选择。为什么?因为它允许您:

  • 保留链接资产和页面权限。 同时,noindex 和 robots.txt 完全禁止索引,这会丢弃与这些页面相关的任何累积链接资产或权限。
  • 保持页面的可发现性,因为即使是非规范页面也可以通过内部链接和站点地- 图被发现。
  • 有效利用爬行预算。 相比之下,Robots.txt可能会阻止爬网并对有价值内容的发现产生负面影响。

不同类别下的相同项目

某些网站(尤其是用于电子商务目的的网站)可能会提供相同的产品,但属于不同的类别。例如,如果您销售女式圣诞毛衣,则这些商品可能被归类为两个网站分类: 女装 和 冬季系列。因此,可以从两个不同的 URL 访问同一件毛衣,例如:

https://www.yourwebsite.com/women-clothing/your-product/
https://www.yourwebsite.com/winter-collection/your-product/

虽然我们可以看到它是同一个产品,但 Google 可能会将这些 URL 视为两个具有重复内容的独立页面。

使用 canonical 标签,您可以告诉搜索机器人这些产品页面中哪些是 “官方” 页面,并避免重复问题。

尽可能避免重复 URL。从 SEO 的角度来看,将类别直接链接到产品的主要版本比使用规范标签更有效。这既可以防止您进行重定向,又可以优化搜索引擎索引。

UTM 标签和跟踪参数

在使用 UTM 标签和跟踪参数时,重要的是要意识到这可能会创建搜索引擎可能会误解为重复内容的 URL。为了解决这个问题,请将规范标签应用于您首选的内容版本,其中不应包含任何 UTM 标签或跟踪参数。通过这样做,您可以确保您的网站被正确索引。

例如,像 https://site.com/page/ 这样的 URL 可能具有带有 https://site.com/page/?fbclid=IwAR3cnDV4ERw24pQNVLTFlwKzchPDA1 等参数的版本。如果从 Facebook 重定向,也可以生成类似的链接。在这种情况下,Canonical 将是一个很好的解决方案。

分页规范化

选择最合适的方法将规范标签添加到您的分页页面可能是一项复杂的任务,因为对最佳方法的看法差异很大。

选项 1:您可以采用传统路线并在所有分页页面上应用自引用规范标签,这是 Google 推荐的。这可确保系列中的每个页面都包含一个指向自身的 canonical 标签,如下例所示:

https://site.com/catalog/page/2/ contains <link rel="canonical" href="https://site.com/catalog/page/2/" />.

这种规范化方法通常被认为是安全的,因为它使 Web 爬虫能够访问分页集中的所有页面并正确索引内容。此外,通过在所有分页页面上使用规范标签,你可以整合该系列中所有页面的链接资产。

选项 2:如果您希望禁止分页页面的索引,则不建议使用 canonicals,因为搜索引擎可能不会响应您的指令。最好改用<meta name=“robots” content=“noindex, follow” />标签。这将使搜索引擎能够抓取和跟踪您网站上的链接,但会阻止对任何分页部分进行索引。

无论您使用哪种解决方案,都必须确保分页页面正确链接到其相应的主要内容,并且正确配置规范标签以避免任何潜在的重复内容问题。

最后

正确使用规范标签是 SEO 的基础,因为它可以防止重复页面和索引问题的发生。但是,如果设置不正确,规范化可能不会带来预期的结果,甚至会因重复内容而导致排名下降。

请遵循此完整指南中有关规范标签的最佳实践,但始终单独评估每种情况。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值