什么是谷歌缓存? 网站所有者需要知道的一切

已发表: 2021-11-19

Google 的网络爬虫不断在互联网上搜索新的和更新的网页。

当这些爬虫为网站的内容编制索引时,它们不仅仅使用这些信息来提供搜索结果。 他们对页面进行备份并将它们添加到一个名为 Google Cache 的统一数据库中。

您可能使用过 Google 缓存来查看已关闭或​​无法正确加载的旧版本网站。 但是您知道您也可以使用它来解决您网站上的问题吗? 它甚至可以帮助您的 SEO 工作。

本文介绍了 Google Cache 以及如何检查它。 我们还将了解 Google Cache 如何发挥作用——以及何时不应过度依赖它。

什么是谷歌缓存?

Google 缓存页面是在 Google 的一次抓取过程中获取的页面内容的原始 HTML 备份。 Google Cache 作为一个整体由这些备份页面组成。

如果您查看网站的缓存版本,它可能看起来很像网站在被抓取时所做的那样。 但有几个原因有时看起来与您的预期不同。

两个主要原因是:

  • 网页由您的浏览器呈现,而不是由 Google 呈现。 这可能会导致与网站当前版本的差异。
  • JavaScript 不会保存到缓存中,因此您网站的某些部分可能会丢失。

在缓存页面的顶部,您会看到一个横幅,其中显示了三件事:

  1. 缓存页面的 URL — 这通常是您要访问的 URL。 在某些情况下,例如重定向的 URL,它会有所不同。
  2. 缓存此版本页面的日期— 您可以查看您正在查看的缓存页面是昨天还是上周创建的。 这不一定是您的网页最后一次被抓取; 我们稍后会谈到。
  3. 版本— 您可以选择查看完整版本、纯文本版本或页面来源。 完整版向您显示浏览器呈现的页面。 纯文本版本关闭了 CSS 并且不显示图像,但您仍会看到超链接。 单击查看源代码会显示页面的源代码:
标题为“Kinsta 博客 - WordPress 教程和资源”的 Kinsta 页面的缓存版本的屏幕截图。
Kinsta 页面的缓存版本示例。
您是否知道您可以使用 Google Cache 来解决您网站上的问题……它甚至可以帮助您进行 SEO 工作? 在这里了解更多️ 点击推

为什么谷歌缓存很重要

Google Cache 的主要用途是供人们浏览互联网。 它允许他们查看已关闭或​​加载有问题的网页。

作为网站所有者,还有其他原因表明 Google 缓存至关重要。 您希望您的网站永远不会出现故障或出现故障,但它确实发生了。 拥有缓存可以让用户可以使用您的内容,即使某些内容无法正常工作。

您还可以使用您网站的缓存版本来了解您的网站是如何被索引并诊断问题的。 请继续阅读以了解更多信息。

如何查看谷歌缓存

您如何从 Google 搜索引擎结果访问缓存的 Google 页面取决于您使用的设备类型。 在桌面网络浏览器中,您有两种选择:

  1. 您可以从 Google 搜索结果中找到指向缓存版本页面的链接。
  2. 您可以直接进入页面。

在移动浏览器上,您只能选择使用直接 URL。

从 Google 搜索结果中查看缓存页面

即使您有从搜索结果页面查看缓存网站的经验,您也可能希望阅读此内容,因为 Google 在 2021 年初改变了查找缓存链接的方式。

首先,在 Google 上搜索您要查看的页面。 在搜索结果中页面的 URL 旁边,您应该会看到三个垂直点。 单击它们,将出现一个标有“关于此结果”的弹出窗口:

谷歌的
谷歌的“关于这个结果”功能。

此功能目前处于测试阶段。 它旨在让您在点击之前了解有关网站的更多信息(例如它是否安全)。

在弹出窗口的右下方,有一个标记为Cached 的按钮。 单击它以查看缓存的页面。

在某些情况下,您可能看不到缓存按钮。 这可能意味着该页面尚未被缓存; 我们稍后会讨论这意味着什么。

但是,如果您使用的是移动设备,您将看不到任何页面的按钮。 在这种情况下,请继续阅读以了解查看缓存页面的另一种方法。

修改 URL 以查看缓存页面

对于这种方法,您必须知道要查看的页面的 URL。 只需在搜索栏中输入cache:website.xyz

例如, cache:kinsta.com将带您直接访问我们的缓存主页。

其他查看 Google 缓存的工具

您不需要任何特殊工具即可查看缓存页面; 谷歌本身就让它变得非常容易。 但是有一些工具具有您可能喜欢的功能。

Chrome 的 Web Cache Viewer 扩展允许您右键单击任何链接以查看页面的 Google Cache 版本和 Wayback Machine Web 存档版本。

Small SEO Tools 的 Google Cache Checker 可让您一次查看最多五个页面缓存的 URL 和日期:

Google Cache Checker 工具结果的屏幕截图,显示了几个 Kinsta 页面。
谷歌缓存检查器。

使用 Google 缓存查看页面的旧版本

您的页面说它是昨天缓存的,但您想查看上周的版本。 谷歌缓存可以吗?

很不幸的是,不行。

Google 只能向您显示缓存页面的单个版本。 要查看以前的网站版本,您可以使用 Wayback Machine 之类的工具,该工具是网页过去版本的存档。

看看我们以前的样子!

Wayback Machine 上 2014 Kinsta 网站的屏幕截图。
Wayback Machine 上的 2014 Kinsta 网站。

使用 Google 缓存作为网站所有者的原因

事实是,还有其他工具可用于完成以下所有操作——在许多情况下,是更复杂的工具。

但 Google Cache 因其快速且易于检查而难以被击败。 这使其成为监控网页某些方面的一种有价值的方法。

作为网站所有者,您可以通过以下五种方式使用 Google 缓存。

1.检查重复内容

有时您单击缓存的链接并进入与您预期不同的页面。

发生这种情况的原因之一是内容重复。 当 Google 看到两个高度相似的页面时,它可能会决定不在索引中将它们分开。 这导致只有一个保留在缓存中。

谷歌在同一个链接下缓存多个页面可以提醒您您的网站上有重复的内容。 重复的内容不仅会造成令人困惑的缓存情况——这对 SEO 不利。

请借此机会检查这两页并找到区分它们的方法。

2. 验证 Google 是否尊重您的规范标签

也许您网站上的重复内容是故意的,但您添加了rel=canonical标签来告诉 Google 要抓取哪个版本。

检查您不想抓取的页面之一的 Google 缓存版本。 您应该被带到规范页面的缓存中。

3.确保您的营销工作已被抓取

您已经加强了您的 SEO 或内容制作工作,并且您希望确保 Google 将这些更改编入索引。

快速查看页面的缓存版本可以告诉您它已被抓取。

请注意,如果您的更改没有出现在缓存页面上,它们可能仍被编入索引。 如果您担心,可以前往 Google Search Console 的 URL Inspector 进行确认。 但是,如果您在缓存中看到您的更新,您就知道它们已被编入索引并将开始影响您的搜索结果排名。

4. 密切关注竞争对手网站的变化

当竞争对手突然抢走您的位置时,您会关心自己的业务,享受您在关键关键字搜索结果顶部的位置。 他们做了什么来到达那里? 您可以使用 Google Cache 来查找。 将他们的缓存页面与当前版本进行比较——您将能够看到竞争对手最近所做的更改。

5. 检索您网站的最新版本

您应该始终备份您的网站,以防万一。 也就是说,有时最坏的情况会发生,即使是最有准备的人。

虽然您网站的 Google Cache 版本不会取代完整备份,但它有时可以让您看到灾难发生前您的网页是什么样子。 您可以使用它来检索丢失的旧内容或代码。

谷歌缓存的限制

Google 的缓存可以提供有用的信息,如果某些东西看起来很奇怪,则值得调查。 但是谷歌缓存有一些已知的限制。

Google 缓存不会告诉您上次抓取页面的时间

让我们从最大的误解之一开始。

很多人认为每次 Googlebot 抓取页面时都会更新缓存。 很多关于这个主题的其他文章会告诉你使用缓存来查看你的页面被抓取的频率。

这不是真的。

我们知道这一点是因为谷歌的约翰·穆勒(John Mueller)在一个帮助线程中告诉我们,他说:

“一般来说,我们并不总是在每次抓取页面时都更新缓存页面。 尤其是当页面没有显着变化时,我们可能会选择只保留 [原文如此] 旧日期。”

这里有一个专业提示:如果您正在寻找有关 Google 抓取您网站的频率、原因以及使用哪些机器人的信息,请忘记缓存。 该数据在 Google Search Console 上。 您可以在侧边栏中的“设置”下找到抓取报告。

但是,您只能在域级别查看此信息。 Search Console 不会告诉您抓取每个页面的频率。

页面可能无法正确呈现

幸运的是,在这方面已经取得了一些进展。 Google 的 Web 渲染服务在网络上渲染实时页面,过去是基于过时的 Chrome 版本。 因此,最新的浏览器有时会以不同于 Google 呈现当前页面的方式呈现缓存页面。

自 2019 年起,Google Web Rendering Service 使用最新版本的 Chrome。

但是,如果您的 Chrome 版本较旧,或者您使用的是其他浏览器,则缓存页面可能无法正确呈现。

另一个渲染问题与缺少资源有关。 Google 备份的代码可能引用 CSS 或 JavaScript 等资源。 如果这些资源不再存在或已更改,则页面将无法正确呈现。

显示错误的页面

我们已经了解了重复内容或不正确的规范标签如何导致 Google 缓存显示错误的页面。 正如您可能想象的那样,这限制了查看特定网页缓存的有用性。

某些页面未缓存

这可能会让人感到意外,但事实证明,许多页面根本没有被缓存。

需要为您的 WordPress 网站提供快速、可靠且完全安全的托管服务? Kinsta 提供所有这些以及来自 WordPress 专家的 24/7 世界级支持。 查看我们的计划

一个普遍的误解是,未缓存的网站意味着谷歌认为它不是必需的,但这不一定是真的。 接下来,我们将看看页面可能没有被缓存的一些原因。

为什么我找不到我的缓存网页?

并非所有已爬网的页面都被缓存。 如果您的页面没有缓存版本,请不要惊慌! 这并不意味着您的页面没有被索引。

指示页面没有缓存版本的 404 错误。
404 错误表示页面没有缓存版本。

如果您担心它确实没有被索引,您可以使用 Google Search Console 的 URL Inspector 进行检查。

为了证明索引页面并不总是被缓存,我们回到 Google 的 John Mueller。 在 Twitter 上,他回复了一位询问未缓存页面的用户:

“我们不会缓存我们索引的所有页面,因此可能会发生这种情况。 有时需要一段时间,有时我们根本不缓存它。”

当用户问他未缓存的网站是否总是低质量时,他说:

“那个+它可以是各种奇怪的技术怪癖的页面。 缓存有点独立,所以它并不代表我们的索引和排名。”

换句话说,缓存页面不是排名因素。 即使您的网页没有缓存版本,您也可以将其置于搜索结果的顶部。

但是一个未缓存的页面仍然可能值得研究。 您可以探索几种不同的可能性。

您的页面是基于 JavaScript 的

谷歌索引一些 JavaScript 驱动的页面比其他页面更容易。 但是许多 JavaScript 页面最终没有缓存,甚至没有索引。

这是因为大多数 HTML 直到 JavaScript 执行后才被加载。 如果没有可索引的内容,Google 将不会创建缓存页面。

元标记防止缓存

页面 HTML 代码中的noindex元标记意味着该页面无法被 Google 索引,而noarchive阻止它被缓存。 任何一个都将导致未缓存的页面。

也许这正是你想要的。 但是,如果您没有意识到页面上有noindexnoarchive标签,删除它可以解决您丢失缓存的问题。

该页面是重复的(或 Google 认为是重复的)

如果 Google 认定您的两个网页重复,请设法使它们独一无二。 考虑每个页面的不同搜索意图。

如何解决网站缓存页面的问题

您的页面不必被缓存,但如果您想实现它,您可以做一些事情。

将您的页面提交给 Google

如果您担心 Google 根本没有将您的页面编入索引,您可以查看 Google Search Console。

在 Search Console 顶部的 URL 检查搜索栏中输入页面的 URL。 如果您得到“URL 在 Google 上”的结果,则该页面已被编入索引。 如果页面最近发生了变化,并且您认为 Google 没有为新版本编制索引,您可以单击请求索引请求 Google 重新索引它。

您可能还会得到“页面不在 Google 上”的结果。 如果这样做,请向下滚动,您将能够看到有关该页面的一些详细信息。 例如,您可以检查该页面是否允许抓取,以及用户选择的规范是否与 Google 选择的规范相匹配。 要请求索引,请单击请求索引

带有指向“请求索引”选项的箭头的 Google Search Console URL 检查工具。
Google Search Console URL 索引请求。

检查常见的站点问题

我们已经介绍了您的页面可能没有被缓存的几个原因,例如大量的 JavaScript 和重复的内容。

除此之外,鼓励频繁索引的最佳方法是创建一个高质量的站点。 确保您已经针对移动设备优化了您的网站,并且您的网站速度很高。

如果您的页面加载时间太慢,它甚至会减慢 Google 的机器人,从而导致索引延迟。

如何从谷歌缓存中删除页面

我们认为 Google 缓存非常有用,但出于各种原因,您可能不希望将旧版本的网页存储在 Google 的服务器上。 例如,您可能不希望停产产品的页面可用。

防止页面缓存的一种方法是使用上面提到的noindexnoarchive标记。 如果您想保留页面但不希望它们被缓存,这些标签是理想的永久解决方案。

您也可以直接要求 Google 从 Google 缓存中删除 URL。 为此,请转到 Google Search Console 并单击栏中的删除。 然后单击新请求。 此时,您有两个选择: Temporarily Remove URLClear Cached URL

临时删除意味着该网址在大约六个月内不会出现在 Google 搜索结果中。 缓存也会消失。 当页面再次上线时,页面将被重新索引并重新缓存(如果您不希望这种情况发生,则必须添加元标记)。

清除缓存的 URL 正是它听起来的样子。 缓存会被移除,但是当网站被爬取时页面会再次被缓存。

如果您希望更新页面的旧版本消失,这是一个很好的方法。 您还可以在更改页面后提交页面以供索引,从而推动 Google 更新页面的缓存。

Google Cache 是解决您网站上的问题的宝贵工具,甚至可以帮助您进行 SEO 工作……但有几个原因您不应该完全依赖它Click to Tweet

概括

谷歌缓存并不是传闻中的一切。 您不能使用它来检查您的网站上次被抓取的时间——拥有它并不会提高您的搜索引擎排名。 有时,它存储的您网站的版本很奇怪、不完整或完全错误。

但谷歌缓存对网站所有者有其用途。 这是检查您的网站如何被索引的快速方法,它可以帮助您发现和诊断问题。 您还可以使用 Google Search Console 来提高您的搜索引擎排名。

您对 Google Cache 有任何疑问吗? 在评论部分让我们知道——我们想听听他们的声音!