搜索引擎优化是一个微妙的过程。 把它想象成一个链环,其中一个薄弱环节就会拖累整个链环,甚至导致链环崩溃。 URL 参数就是一个很好的例子。 您需要它们来管理大型网站、广泛的产品目录、跟踪营销活动以及其他相关任务。 但是,URL 参数管理不当会导致内容重复、抓取问题,甚至会完全破坏您辛苦的搜索引擎优化工作。
本文将介绍 URL 参数的基础知识、使用案例、常见问题以及如何监控它们。 您还将了解如何从搜索引擎优化的角度正确管理它们。 让我们深入了解!
什么是 URL 参数?
URL 参数(又称 URL 查询参数或查询字符串)是添加到网址问号(?)之后的额外信息,用于修改或跟踪页面内容。 根据谷歌的说法,它们可以是主动(修改内容)参数,也可以是被动(跟踪)参数。 被动参数不会更改页面内容。
URL 参数由一个键和一个值组成,中间用等号 (=) 隔开。 一个 URL 中的多个参数用"&"符号分隔。 URL 中的第一个参数总是在问号(?)
例如:
- URL 参数常用于电子商务。 过滤搜索结果时,URL 可能如下所示: https://www.example.com/ski-clothing?category=women
在哪里?
- ? – 标记查询字符串的开头
- category – 键
- women – 价值
- = 值分隔符
- category=women – 一个 URL 参数,用于帮助筛选滑雪服部分以仅显示女性商品。
- 在 YouTube 上,URL 可能包含时间戳:https://www.youtube.com/watch?v=p8M2SdGb7bE&t=120s
此 URL 包含两个参数:
- v=p8M2SdGb7bE 是视频 ID 参数,它告诉 YouTube 要加载哪个特定视频。
- t=120s 是时间戳参数,用于告诉 YouTube 从 120 秒(2 分钟)开始播放视频,而不是从头开始播放。
URL 参数: 用途和示例
如前所述,URL 参数分为两类:主动参数和被动参数。
但动态和静态 URL 与主动和被动参数并不相同。
原因就在这里。
静态 URL 是不带任何参数的普通网址(如 https://seranking.com/website-audit.html)。
动态 URL 通常包含参数(如 https://seranking.com/?ga=3126575&source=link)。动态 URL 可以包含主动参数或被动参数,也可以同时包含这两种参数。
主动参数
主动参数会直接影响页面上显示的内容,并根据用户的输入和偏好进行更新。 主动 URL 参数最常见的用途和示例包括
过滤和排序
用于根据应用的过滤或排序标准(如价格、颜色或评级)显示用户希望看到的内容。
例如:
?sort=za
(从 Z 到 A 按字母顺序排列产品)
?color=dark
(只显示深色产品)
?rating=5
(过滤 5 星评级的产品)
?filter=automatic
(只显示自动产品)
搜索
帮助用户通过 URL 在网站上查找特定信息。 该 URL 参数(通常为 “q”,表示 “查询”)包含用户在搜索框中输入的内容。
例如:?q=seranking
(显示网站上 "SE Ranking "的搜索结果)
分页
通过指定要显示的页面来浏览多页内容。 与在单个页面上加载大型数据集(速度慢且难以承受)相比,分页将内容分为一系列相关页面。 使用该参数可以告诉服务器加载哪个 “块”。
例如:?page=2
(加载第二页结果)
翻译
用于将页面内容切换为不同语言。 当用户选择语言偏好时,该 URL 参数可确保他们看到的内容是他们偏好的语言。 如果您有一个国际网站,并希望提供本地化体验,这一点至关重要。
例如:?lang=en
(显示页面的英文版本)
被动参数
被动参数可帮助营销人员跟踪不同渠道的营销效果数据。 与主动参数不同,这些参数不会改变用户在页面上看到的内容。
请注意,网站可以使用自定义参数进行高级跟踪。 与 UTM 标签等固定参数不同,自定义参数可让您对记录的信息(值)进行更多控制,如独特的业务指标、用户细分或营销活动属性。
以下是被动参数的一些常见用例:
跟踪和分析
这些功能可帮助营销人员确定流量的来源。 这可能包括营销活动、付费广告或用户点击的电子邮件。 UTM 参数(如 utm_source、utm_medium 和 utm_campaign)告诉分析工具用户如何找到您的网站。
例如:?utm_source=newsletter
(表示访客通过电子邮件时事通讯进入网站)
联盟 ID
这些参数的一个常见用途是通过联盟营销计划。 当有人点击包含联属 ID 的链接时,网站会跟踪该点击,以便将任何销售或注册归功于正确的合作伙伴。 这有助于企业准确了解销售或转换的来源。
例如:?id=seranking
(跟踪用户通过与 SE Ranking 相关联的联盟链接进行的点击)
视频时间戳
这些参数可让用户跳转到视频中的特定位置,而不是从头开始。 它们是分享长视频中突出瞬间的首选。 虽然它们会改变观众开始观看视频的位置,但由于不会改变实际内容,因此被认为是被动的。
例如:(视频从 60 秒开始)?t=60s
URL 参数对搜索引擎优化的负面影响
URL 查询参数看似简单实用,但如果处理不当,可能会造成重大的搜索引擎优化问题。
搜索引擎在抓取和索引大型网站时会遇到很多动态生成的、结构不良的 URL,或者带有多个参数的 URL。 如果页面内容几乎没有重大变化,搜索引擎可能会将每个 URL 及其参数视为同一页面的单独版本。
这可能会导致下面讨论的问题。
重复内容和关键词蚕食
在使用 URL 参数时生成多个 URL(尤其是当这些 URL 显示的大多是相同内容时),一个常见的大问题就是内容重复。 随之而来的是关键词蚕食,这会导致页面(尤其是带有附加参数的页面)开始竞争。 被蚕食的页面往往以相同的关键词群为目标,具有相同的搜索意图,涵盖相同的语义主题。
想象一下,当您同时使用多个过滤和排序选项时,会有多少几乎相同的页面出现!
例如,URL 中用于过滤的活动查询参数(如 www.store.com/laptops?brand=dell 和 www.store.com/laptops?brand=apple)会根据品牌创建完全不同的页面。 但是,谷歌可能会将它们注册为具有细微差别的相同基本页面。
跟踪 www.seranking.com/blog 和 www.seranking.com/blog?utm_campaign=black_friday 等被动参数也是如此。 两者都指向同一个博客页面。 人类很容易分辨出额外的参数是用于跟踪的,但搜索引擎可能无法理解这一点。 例如,Google 就很难决定对哪个版本进行排名。 这会降低内容的权威性,影响排名。
您可以将每个含参数的 URL 规范化为主版本(未经过滤、不含参数的原始页面),从而避免这种情况。 稍后我们将详细介绍这一点。
抓取预算损失
搜索引擎用于发现和索引网站页面的抓取预算是有限的。 如果网站上有成千上万个基于参数的 URL,显示的内容又大同小异,就会白白浪费预算。
例如,一个拥有 100 种产品和 5 个过滤器(颜色、尺寸、价格、品牌、评级)的电子商务网站可能会产生数万个不同参数组合的独特 URL。 谷歌可能要花费数天时间来抓取这些变化,而不是找到最重要的页面并编制索引。
谷歌说得很好:
稀释排名信号
当同一页面有多个 URL 版本时,网站获得的排名权就会被分割。 例如,如果有十个网站因参数不同而链接到您网页的不同版本,那么您最终会拥有十个 "较弱 "的网页,而不是一个整合了所有这些信号的强大网页。 这种稀释使得任何一个版本都很难获得好的排名,即使你有很好的内容。
URL 可读性差
当 URL 过长、杂乱无章或包含令人困惑的参数时,就会出现 URL 可读性差的问题。 这使得用户和搜索引擎难以理解内容。 这样的 URL 更难在电子邮件、社交媒体和论坛中分享。 口头交流也很困难,而且对于某些用户来说,它们还可能显得可疑或不可信。
用户更愿意点击简洁、搜索引擎优化友好的 URL,这也更有利于页面性能和排名。
跟踪问题
参数过多的 URL 会扭曲您对分析数据的理解。
假设您是一家使用 Google Analytics 4 的电子商务企业,您的产品页面可以通过多个 URL 参数组合访问。 您的许多报告都基于单个 URL。 由于对每个页面都进行了单独跟踪,因此它显示的不是清晰的页面性能数据,而是来自原始页面多个版本的零散数据。 这将导致难以分析的误导性数据,从而掩盖营销工作、有机流量或用户行为的真实有效性。
由于您的目标是更清晰地了解网站的整体性能,因此下一步应该是设置特殊配置。
如何解决 URL 参数问题
每个与 URL 参数相关的问题都会引出一个问题–如何告诉 Google 哪些 URL 版本需要抓取,哪些需要忽略? 让我们来看看如何控制这些问题。
Rel=“Canonical” 链接属性
第一个合理的解决方案是设置规范标签。 规范标签告诉搜索引擎哪个版本的页面是主要的。 这将排名信号整合到所选的 URL 上。
一种常见的解决方案是在每个 URL 变体的 <head>
部分添加此规范标签:
<link rel="canonical" href="https://seranking.com/preferred-page.html"/>
请记住,这种解决方案并非万能。
当参数化 URL 的内容与规范版本相似时,这种方法最为有效。 它最适用于排序参数、跟踪参数以及不会明显修改页面内容的小过滤。
由于规范标签是提示而不是指令,因此 Google 可以直接忽略它们。 此外,它们也不会消除抓取预算的浪费。 这是因为搜索引擎仍然必须抓取所有基于参数的页面–尽管随着时间的推移,你可以哄骗搜索引擎减少对它们的抓取。 如果担心这种情况,可以考虑本节讨论的其他解决方案。
Robots noindex 元标签
robots 元标签可以阻止搜索引擎索引基于参数的页面。 它们仍会被抓取,但抓取频率较低。 但请记住,这种方法并不能巩固排名信号。
要使用 robots noindex 元标签,请在页面 HTML 的 <head>
部分添加以下一行:
<meta name="robots" content="noindex">
对于缺乏搜索引擎优化价值的页面,以及对于用户来说找到这些页面并不重要的页面,这是一个理想的解决方案。
robots.txt 禁止
节省基于参数的 URL 的抓取预算的一个常用方法是通过 robots.txt 文件,该文件可阻止爬虫访问某些页面。 但并不能保证这些页面会被排除在搜索结果之外。
尽管搜索引擎可能会不顾指令而索引它们,但你的主要目标是为搜索引擎提供一个路线图,让它知道哪些页面需要抓取和忽略。 与使用 robots 元标签类似,这种方法并不能巩固排名信号。
要使用禁止指令,请阻止爬虫抓取所有带问号的 URL:
User-agent: *
Disallow: /*?*
您也可以限制机器人访问特定参数:
User-agent: *
Disallow: /*?filter=
Disallow: /*?sort=
从动态网址转向静态网址
静态 URL(如 www.example.com/shoes/running)通常比基于参数的 URL(如 www.example.com/products?category=shoes&type=running)更利于搜索引擎优化。
但并非所有东西都应该是静态的。 使用静态 URL 进行筛选、排序、分页或跟踪会损害搜索引擎优化,因为它们会产生大量重复内容,削弱页面权威性,并在低价值页面上浪费抓取预算。
从动态 URL 转为静态 URL 只对包含核心内容的重要页面有意义。 这些页面可能包括产品页面、类别以及用户搜索的顶级过滤器。 它们看起来更整洁,包含有价值的关键词,谷歌也喜欢它们。 但是,当用户需要进行更复杂的交互时,可以从参数中获益。
理想的方法是为搜索结果中显示的内容使用静态 URL。 正确管理所有其他 URL 的参数(使用 canonicals、noindex 标签)。
监控带参数的 URL
了解网站 URL 参数的影响可以决定 SEO 的健康程度。 以下是一些了解它们的方法。
通过谷歌分析
Google Analytics 4 是一款简单明了的工具。 它的 "页面和屏幕 "报告通过显示哪些 URL 变体获得了流量以及用户是如何与它们互动的,向您展示用户是如何与基于参数的页面互动的。
要访问这些数据:
- 转到左侧菜单中的报告。
- 导航至 “参与”>“页面和屏幕”。
- 在搜索栏中输入问号(?),过滤出包含参数的 URL。
- 根据流量、参与度和转化率分析这些 URL 的性能。
- 找出参数对用户有价值的页面,并使用上述解决方案确定哪些更适合管理。
注意:如果不显示含参数的 URL,请启用完整的 URL 路径:
- 单击报告自定义图标。
- 在 "报告数据 "部分,选择 “维度”。
- 添加新维度 页面路径 + 查询字符串。
- 单击 "应用 "保存更改。
通过 Google Search Console
Google Search Console 报告可帮助您更深入地了解 Google 如何抓取和索引基于参数的 URL。 它们还能显示哪些URL需要更好地管理,以防止出现搜索引擎优化问题。
要访问这些数据:
- 转到左侧菜单中的页面索引报告。
- 滚动浏览带参数的索引 URL 列表。
- 单击 "查看有关索引页面的数据 "部分。
- 按 URL 过滤列表,只显示包含问号 (?) 的页面。
您还可以点击放大镜图标检查每个 URL,以验证您的控制(如 noindex 或 canonical 标记)是否按预期运行。
您还可以查看未被索引的参数化 URL 列表,该列表位于页面索引报告的图表下方。 使用它可以了解它们未被索引的原因,尤其是在您需要它们被索引的情况下。
使用 SE Ranking 的网站审核工具控制参数化 URL
在执行网站审核时,请务必忽略任何可能会扭曲数据和网站搜索引擎优化健康分析的基于参数的 URL。 这样可以确保审计集中在最重要的页面上,并忽略对网站 SEO 无益的基于参数的 URL。
SE Ranking 的网站审计允许您轻松设置网站扫描设置。 具体方法如下:
- 进入网站审核,点击右上角的设置按钮。
- 转到 "扫描页面规则 "区块。
- 向下滚动到 URL 参数设置。 如果要从扫描中排除 URL 中的所有查询参数,请选择 "忽略所有参数 "选项。 这将在整个扫描过程中忽略 URL 变量中的任何值。
- 如果只想排除特定参数,请选择忽略自定义参数选项。 然后手动输入要排除的参数,如 utm_source、筛选器、排序等。
- 选择要忽略的参数后,单击 “应用更改”。
- 保存设置后,运行扫描。
现在,该工具将排除指定的参数,为您提供更准确的网站搜索引擎优化性能图像。 它还会突出显示网站的首要问题,并显示受影响页面的数量。 点击了解更多详情,以获得如何解决这些问题的有用建议。
最后
本文并不是要强行决定在搜索引擎优化策略中使用 URL 参数。 而是要了解何时何地使用这些参数才有意义。
无论如何,您都需要引导搜索引擎爬虫抓取和索引哪些参数化 URL。 正确实施指向主页面版本的规范标签有助于保持一致性。 Google 会识别这些模式并进行相应处理。 监控您所做任何更改的影响,以保持正确的方向。