什么是规范网址(Canonical URL)?搜索引擎优化指南
从重复内容到 Google 如何选择您的规范页面,解决您关于规范网址(Canonical URL)的所有迫切问题。
“规范标签(Canonical tag)”一词经常出现在围绕 SEO 的讨论中,乍一看,这似乎有点吓人,尤其如果您是 SEO 领域的新手。
不过好消息是:通过本指南,我们将详细介绍什么是规范标签、它们为何重要等等。
文章目录
什么是规范?
首先,在我们定义规范标签之前,您需要明白一点:规范标签不是像 Robots.txt 文件那样的指令。
这意味着谷歌将规范标签视为一个强有力的提示,但最终,它会考虑许多信号并决定是否尊重它们。
现在我们已经掌握了黄金法则,让我们来看看它是什么!
规范标签于 2009 年作为源代码中的一个 HTML 标签开始发挥作用,用于告诉搜索引擎哪个网址是页面的主版本。这可以用来告诉谷歌它应该为用户索引哪些页面变体。
规范标记是页面上的 HTML 标记本身,但“规范(canonical)”——现在,这有点不同。
定义规范变体有两种简单的方法:用户声明的规范和 Google 声明的规范。
- 用户声明的规范:这正是它所说的;它是规范标签中指定的规范。
- Google 声明的规范:这是 Google 选择作为规范的 URL。
如果您有权访问 Google Search Console,则可以利用网址检查工具查看上述两种规范类型。
在理想状态下,它们匹配——但如果它们不匹配怎么办?接下来我们将详细讨论。
Google 如何选择规范网址
当 Google 抓取网站并将其编入索引时,它会查看页面上的主要内容。
在此爬网中,它可能会发现相似的页面,然后谷歌将选择它认为最能代表该页面试图向用户传达的内容的页面,并将其选为规范页面。
正如我们上面所讨论的,规范标签不是指令,因此除了规范标签本身之外,Google 还会考虑其他信号——所以要保持一致!
内部链接和外部链接只是 Google 考虑使用规范标签的几个附加因素。
注意:如果您使用/?some_parameter=xyz 之类的查询参数在内部链接您的页面,Google 很有可能会忽略您的规范元标记并选择带有查询参数的 URL 作为规范。
Google 非常积极地抓取 RSS,因此请确保您声明的规范与您的 RSS 提要中的 URL 匹配。
如果您使用/?source=feed等参数将 URL 添加到您的 RSS 提要中,以跟踪来自 RSS 订阅者的网站流量,那么 Google 有可能会选择带有查询字符串e /?source=feed的规范,即使这是一个跟踪参数——谷歌知道这一点。
您可以对 RSS 提要中的 URL 使用链接缩短服务,以便能够跟踪对它们的点击或使用FeedPress等 RSS 服务。
谷歌也会为了用户体验做出选择。
如果您有网站的桌面版本,Google 可能会向移动设备上的用户提供移动版本。
规范标签如何对 SEO 有所帮助
规范标签对于拥有少量页面和数百万页面的网站至关重要。
出于几个原因,它们是必要的。
1.您选择规范标签
规范标签让您有机会向 Google 建议您希望提供给用户的网站页面的最佳版本。
2. 重复内容
重复内容是表面上看似简单但比其名称所显示的更复杂的领域之一,并且往往带有负面含义。
因此,您可能会想,“我没有任何重复的页面”,但在做出该声明之前,让我们快速浏览一下通过Google 搜索中心文档可以定义为“重复”的内容。
重复页面可以归类为包含相同语言的相同主要内容的任何页面。假设您使用不同的页面来支持移动页面(m.、amp 等)和有助于参数或会话 ID 等内容的动态 URL。
在这种情况下,您的博客会在多个文件夹中创建路径;您有网站的 HTTP 和 HTTPS 版本,并且您的网站有重复的内容。这没什么好惊慌的,而且很常见,因此具有规范的重要性!
3. Google 使用 Canonicals 作为其主要来源
Google 利用规范来确定页面的内容和质量。
规范页面比非规范页面更频繁地被抓取。
4.可能有助于抓取预算
如果您有一个相对较大的网站,您可能已经听说过“抓取预算”这个词。
如果操作正确,规范可以帮助减轻您的抓取预算负担,因为 Google 将比非规范版本更频繁地抓取网页的规范版本。
这不是无索引标签、重定向或机器人指令的替代品。
5. 整合链路信号
Canonicals 引导搜索引擎获取他们为多个相似页面提供的各种信息,并将其整合到一个 URL 中,从而增加其价值。
6. 内容联合
如果您有一个网站将其内容联合发布或被合作伙伴利用,您需要确保它是您的版本出现在搜索结果中。
如何实现规范标签
既然我们已经了解了规范标签的内容和原因,让我们再谈谈如何在您的网站上实施规范标签。
当页面是整合指标跟踪、HTTPS 版本、移动体验等内容的最佳版本时,页面可以(并且应该)具有自引用规范。
除非您可以直接编辑 HTML,否则您可能需要与您的开发/工程合作伙伴合作。
规范标签是您添加到任何页面的
部分的一行代码。它看起来像这样:
规范标签常见问答
问:我可以跨域规范吗?
答:是的,你绝对可以。例如,如果您有多个网站,您在多个网站上发布同一篇文章,则使用规范标签会将所有功能集中在您选择作为规范的版本上。在使用您不拥有的网站时,这对于联合内容最佳做法也是一种很好的做法。
问:规范标签是否传递链接资产?
答:共识是肯定的,他们确实如此,但不应将规范错误误认为与 301 重定向相同。
问:我应该使用规范标签还是无索引标签?
答:首先,无索引标签是一个指令,与旨在将页面从索引中删除的规范标签不同。当您想将所有链接和相关信号整合到一个 URL 中时,Canonical 标记是一个很好的解决方案。
我们在 SEO 领域最喜欢的答案适用于这个问题,“这取决于。” 在约翰·穆勒 (John Mueller) 讨论何时使用规范或无索引的话题中,他更详细地回答了在选择一个而不是另一个时要问自己的问题,或者……两者兼而有之。
问:我应该使用 301 重定向还是规范标签?
A: 301 和无索引标签一样,是一个指令。这是另一种“视情况而定”的情况;但是,在选择其中之一时需要考虑一些事项。如果您有两个非常相似的页面,并且出于业务原因不需要两者都处于活动状态,那么 301 重定向可能是一个不错的选择。
一个很好的例子是永久缺货的产品页面或不再值得更新的旧页面。
问:如果 Google 不尊重选择的规范怎么办?
答:如上所述,有时 Google 可能不尊重您选择的规范,您可以通过 Google Search Console 中的 网址检查 工具查看该信息。Google 不尊重用户选择的规范可能有多种原因。
标签可能没有正确实现;站点信号与所选规范和各种其他可能性相矛盾。您可能需要执行一些分析来确定根本原因。
总结
我们希望本指南能够帮助您了解规范标签的使用内容、位置和原因。请务必查看您的规范标签,并查看可以在哪些方面进行改进以帮助搜索引擎注意到您的首选信息。
推荐阅读:
- 17个超实用 WordPress SEO 初学者技巧
- WordPress网站SEO优化的基本建议
- 6个优秀的WordPress SEO插件
- 为你的 WordPress 站点添加 robots.txt
- Google Search Console 警告“已编入索引,尽管遭到 robots.txt 屏蔽” 的处理方案