URL的规范思考
什么是url
URL(Uniform Resource Locator)是用于标识和定位互联网上资源的字符串。URL的命名规范通常包括以下方面:
- 协议(Scheme):指定访问资源所需的协议,例如 “http”、“https”、“ftp” 等。例如,
http://www.example.com
中的 “http” 就是协议。 - 主机名(Host):标识资源所在的主机(服务器)的名称。在
http://www.example.com
中,“www.example.com” 就是主机名。 - 路径(Path):指定资源在服务器上的位置。在
http://www.example.com/page1
中,“/page1” 就是路径。 - 查询字符串(Query String):包含对资源的请求参数,以键值对的形式存在,用 “?” 标识。例如,
http://www.example.com/search?q=query
中的 “q=query” 就是查询字符串。 - 片段标识符(Fragment Identifier):指定资源中的一个特定部分,以 “#” 标识。在
http://www.example.com/page#section1
中,“section1” 就是片段标识符。
URI 的最常见形式是统一资源定位符 (URL),它也被称为 Web 地址。
https://developer.mozilla.org
https://developer.mozilla.org/zh-CN/docs/Learn/
https://developer.mozilla.org/zh-CN/search?q=URL
为什么需要URL规范
当我们浏览网页时,网址就是URL。URL规范化就好比给网址穿了一套整齐的衣服,让它看起来更漂亮、更容易理解。
想象一下,如果一个网址写得乱七八糟、没规律,就像一团乱麻,不仅让人感到困惑,而且对搜索引擎也不友好。而通过URL规范化,我们可以给每个网址穿上整洁的衣服,让它们更容易被理解和记住。
- 用户角度: 规范的URL让网址更好懂,就像整理好的街区,你能轻松找到目的地。对用户来说,这就是方便和友好的网站体验。
- 搜索引擎: 搜索引擎喜欢整齐划一的地址,就像是给它们提供了一张清晰的地图。这样,搜索引擎更容易理解你的网站内容,让你的网站在搜索结果中更靠前。
- 开发者: 对开发者来说,规范的URL就像是整理好的文件夹结构,让代码更容易管理。修改网站结构或者处理请求也更得心应手,避免了不必要的麻烦。
这种整理有助于搜索引擎更好地了解网站的内容,提高网站在搜索结果中的排名。同时,对于用户来说,规范的网址结构也更易读,让他们更轻松地找到他们想要的信息。
所以,URL规范化就是为了让网址更整洁、更易懂,使得网站更受欢迎,搜索引擎更喜欢,用户更满意。
设计URL建议的规范
一、URL中的字母全部用小写
使用小写字母,这样用户输入更容易,避免因大小写问题导致错误。同时,服务器和搜索引擎对大小写敏感,保持一致性可以避免一些问题。
- 正例:
https://example.com/page
- 反例:
https://example.com/Page
(大小写不一致)
二、连续单词使用中划线(-)连接符
在目录或文件名中,使用中划线(-)连接单词。这样做不仅使URL更易读,而且搜索引擎会将中划线视为单词间的分隔符,提高关键词识别准确性。
- 正例:
https://example.com/seo-friendly-url
- 反例:
https://example.com/seo_friendly_url
(使用下划线)
三、URL中建议不超过3个参数
设计的则是URL中的参数应该尽量减少,不要超过三个,一般的情况下URL中的参数2-3个就可以了。
- 正例:
https://example.com/product?id=123&category=books
- 反例:
https://example.com/product?id=123&category=books&color=red
(参数过多)
四、URL长度限制2048
尽量控制URL长度,不要超过2048个字符。过长的URL可能会导致浏览器和搜索引擎的兼容性问题。
- 正例:
https://example.com/short-url
- 反例:(假设超过2048字符,超出范围)
五、避免特殊字符
避免在URL中使用特殊字符,尤其是一些需要编码的字符。不同的浏览器和服务器对这些字符的处理方式可能不同,为了保持一致性和可靠性,最好避免使用它们。
- 正例:
https://example.com/page-without-special-chars
- 反例:
https://example.com/page$pecial
(包含特殊字符)
六、清晰而有意义的路径
URL路径应该简洁而有意义,反映网站的内容结构。使用描述性的词汇,使用户能够直观理解页面的主题。
- 正例:
https://example.com/blog/seo-best-practices
- 反例:
https://example.com/page/123
七、避免使用日期作为路径
避免将日期作为URL路径的一部分,除非网站内容与日期紧密相关。这有助于提高URL的持久性和可维护性。
- 正例:
https://example.com/news/latest-update
- 反例:
https://example.com/blog/2023/01/15
八、使用可读性高的字词
在URL中使用能够清晰表达内容的字词,而不是一些无意义的字符或数字。这有助于用户理解链接指向的内容。
- 正例:
https://example.com/how-to-create-seo-friendly-urls
- 反例:
https://example.com/page/12345
九、统一的URL结构
在整个网站中保持统一的URL结构,有助于用户和搜索引擎更容易理解和记忆。一致性的URL结构使整个网站更具专业性。
- 正例:
https://example.com/category/product-name
- 反例:
https://example.com/product-name/category
十、使用永久重定向
如果需要更改URL结构,使用永久重定向(301 Redirect)来保持搜索引擎索引的一致性,同时避免用户访问旧链接时产生404错误。
十一、对移动设备进行优化
如果有移动版本的网页,可以考虑使用响应式设计或专门的移动URL,以提供更好的移动设备体验。
- 正例:
https://m.example.com/page
- 注意:确保在移动和桌面版本之间设置正确的重定向和链接关系。
十二、处理尾部斜杠
处理尾部斜杠是指对URL的结尾是否包含斜杠(/)进行统一处理。在许多情况下,URL的尾部斜杠是否存在可能不影响实际的页面访问,但在一些情况下,它可以产生不同的效果。为了保持一致性和规范性,可以采取一致的策略来处理这个问题。