什麼是谷歌緩存? 網站所有者需要知道的一切
已發表: 2021-11-19Google 的網絡爬蟲不斷在互聯網上搜索新的和更新的網頁。
當這些爬蟲為網站的內容編制索引時,它們不僅僅使用這些信息來提供搜索結果。 他們對頁面進行備份並將它們添加到一個名為 Google Cache 的統一數據庫中。
您可能使用過 Google 緩存來查看已關閉或無法正確加載的舊版本網站。 但是您知道您也可以使用它來解決您網站上的問題嗎? 它甚至可以幫助您的 SEO 工作。
本文介紹了 Google Cache 以及如何檢查它。 我們還將了解 Google Cache 如何發揮作用——以及何時不應過度依賴它。
什麼是谷歌緩存?
Google 緩存頁面是在 Google 的一次抓取過程中獲取的頁面內容的原始 HTML 備份。 Google Cache 作為一個整體由這些備份頁面組成。
如果您查看網站的緩存版本,它可能看起來很像網站在被抓取時所做的那樣。 但有幾個原因有時看起來與您的預期不同。
兩個主要原因是:
- 網頁由您的瀏覽器呈現,而不是由 Google 呈現。 這可能會導致與網站當前版本的差異。
- JavaScript 不會保存到緩存中,因此您網站的某些部分可能會丟失。
在緩存頁面的頂部,您會看到一個橫幅,其中顯示了三件事:
- 緩存頁面的 URL — 這通常是您要訪問的 URL。 在某些情況下,例如重定向的 URL,它會有所不同。
- 緩存此版本頁面的日期— 您可以查看您正在查看的緩存頁面是昨天還是上週創建的。 這不一定是您的網頁最後一次被抓取; 我們稍後會談到。
- 版本— 您可以選擇查看完整版本、純文本版本或頁面來源。 完整版向您顯示瀏覽器呈現的頁面。 純文本版本關閉了 CSS 並且不顯示圖像,但您仍會看到超鏈接。 單擊查看源代碼會顯示頁面的源代碼:

為什麼谷歌緩存很重要
Google Cache 的主要用途是供人們瀏覽互聯網。 它允許他們查看已關閉或加載有問題的網頁。
作為網站所有者,還有其他原因表明 Google 緩存至關重要。 您希望您的網站永遠不會出現故障或出現故障,但它確實發生了。 擁有緩存可以讓用戶可以使用您的內容,即使某些內容無法正常工作。
您還可以使用您網站的緩存版本來了解您的網站是如何被索引並診斷問題的。 請繼續閱讀以了解更多信息。
如何查看谷歌緩存
您如何從 Google 搜索引擎結果訪問緩存的 Google 頁面取決於您使用的設備類型。 在桌面網絡瀏覽器中,您有兩種選擇:
- 您可以從 Google 搜索結果中找到指向緩存版本頁面的鏈接。
- 您可以直接進入頁面。
在移動瀏覽器上,您只能選擇使用直接 URL。
從 Google 搜索結果中查看緩存頁面
即使您有從搜索結果頁面查看緩存網站的經驗,您也可能希望閱讀此內容,因為 Google 在 2021 年初改變了查找緩存鏈接的方式。
首先,在 Google 上搜索您要查看的頁面。 在搜索結果中頁面的 URL 旁邊,您應該會看到三個垂直點。 單擊它們,將出現一個標有“關於此結果”的彈出窗口:
此功能目前處於測試階段。 它旨在讓您在點擊之前了解有關網站的更多信息(例如它是否安全)。
在彈出窗口的右下方,有一個標記為Cached 的按鈕。 單擊它以查看緩存的頁面。
在某些情況下,您可能看不到緩存按鈕。 這可能意味著該頁面尚未被緩存; 我們稍後會討論這意味著什麼。
但是,如果您使用的是移動設備,您將看不到任何頁面的按鈕。 在這種情況下,請繼續閱讀以了解查看緩存頁面的另一種方法。
修改 URL 以查看緩存頁面
對於這種方法,您必須知道要查看的頁面的 URL。 只需在搜索欄中輸入cache:website.xyz
。
例如, cache:kinsta.com
將帶您直接訪問我們的緩存主頁。
其他查看 Google 緩存的工具
您不需要任何特殊工具即可查看緩存頁面; 谷歌本身就讓它變得非常容易。 但是有一些工具具有您可能喜歡的功能。
Chrome 的 Web Cache Viewer 擴展允許您右鍵單擊任何鏈接以查看頁面的 Google Cache 版本和 Wayback Machine Web 存檔版本。
Small SEO Tools 的 Google Cache Checker 可讓您一次查看最多五個頁面緩存的 URL 和日期:
使用 Google 緩存查看頁面的舊版本
您的頁面說它是昨天緩存的,但您想查看上週的版本。 谷歌緩存可以嗎?
很不幸的是,不行。
Google 只能向您顯示緩存頁面的單個版本。 要查看以前的網站版本,您可以使用 Wayback Machine 之類的工具,該工具是網頁過去版本的存檔。
看看我們以前的樣子!
使用 Google 緩存作為網站所有者的原因
事實是,還有其他工具可用於完成以下所有操作——在許多情況下,是更複雜的工具。
但 Google Cache 因其快速且易於檢查而難以被擊敗。 這使其成為監控網頁某些方面的一種有價值的方法。
作為網站所有者,您可以通過以下五種方式使用 Google 緩存。
1.檢查重複內容
有時您單擊緩存的鏈接並進入與您預期不同的頁面。
發生這種情況的原因之一是內容重複。 當 Google 看到兩個高度相似的頁面時,它可能會決定不在索引中將它們分開。 這導致只有一個保留在緩存中。
谷歌在同一個鏈接下緩存多個頁面可以提醒您您的網站上有重複的內容。 重複的內容不僅會造成令人困惑的緩存情況——這對 SEO 不利。
請藉此機會檢查這兩頁並找到區分它們的方法。
2. 驗證 Google 是否尊重您的規範標籤
也許您網站上的重複內容是故意的,但您添加了rel=canonical
標籤來告訴 Google 要抓取哪個版本。
檢查您不想抓取的頁面之一的 Google 緩存版本。 您應該被帶到規範頁面的緩存中。
3.確保您的營銷工作已被抓取
您已經加強了您的 SEO 或內容製作工作,並且您希望確保 Google 將這些更改編入索引。
快速查看頁面的緩存版本可以告訴您它已被抓取。
請注意,如果您的更改沒有出現在緩存頁面上,它們可能仍被編入索引。 如果您擔心,可以前往 Google Search Console 的 URL Inspector 進行確認。 但是,如果您在緩存中看到您的更新,您就知道它們已被編入索引並將開始影響您的搜索結果排名。
4. 密切關注競爭對手網站的變化
當競爭對手突然搶走您的位置時,您會關心自己的業務,享受您在關鍵關鍵字搜索結果頂部的位置。 他們做了什麼來到達那裡? 您可以使用 Google Cache 來查找。 將他們的緩存頁面與當前版本進行比較——您將能夠看到競爭對手最近所做的更改。
5. 檢索您網站的最新版本
您應該始終備份您的網站,以防萬一。 也就是說,有時最壞的情況會發生,即使是最有準備的人。
雖然您網站的 Google Cache 版本不會取代完整備份,但它有時可以讓您看到災難發生前您的網頁是什麼樣子。 您可以使用它來檢索丟失的舊內容或代碼。
谷歌緩存的限制
Google 的緩存可以提供有用的信息,如果某些東西看起來很奇怪,則值得調查。 但是谷歌緩存有一些已知的限制。
Google 緩存不會告訴您上次抓取頁面的時間
讓我們從最大的誤解之一開始。
很多人認為每次 Googlebot 抓取頁面時都會更新緩存。 很多關於這個主題的其他文章會告訴你使用緩存來查看你的頁面被抓取的頻率。
這不是真的。
我們知道這一點是因為谷歌的約翰·穆勒(John Mueller)在一個幫助線程中告訴我們,他說:
“一般來說,我們並不總是在每次抓取頁面時都更新緩存頁面。 尤其是當頁面沒有顯著變化時,我們可能會選擇只保留 [原文如此] 舊日期。”
這裡有一個專業提示:如果您正在尋找有關 Google 抓取您網站的頻率、原因以及使用哪些機器人的信息,請忘記緩存。 該數據在 Google Search Console 上。 您可以在側邊欄中的“設置”下找到抓取報告。
但是,您只能在域級別查看此信息。 Search Console 不會告訴您抓取每個頁面的頻率。
頁面可能無法正確呈現
幸運的是,在這方面已經取得了一些進展。 Google 的 Web 渲染服務在網絡上渲染實時頁面,過去是基於過時的 Chrome 版本。 因此,最新的瀏覽器有時會以不同於 Google 呈現當前頁面的方式呈現緩存頁面。
自 2019 年起,Google Web Rendering Service 使用最新版本的 Chrome。
但是,如果您的 Chrome 版本較舊,或者您使用的是其他瀏覽器,則緩存頁面可能無法正確呈現。
另一個渲染問題與缺少資源有關。 Google 備份的代碼可能引用 CSS 或 JavaScript 等資源。 如果這些資源不再存在或已更改,則頁面將無法正確呈現。
顯示錯誤的頁面
我們已經了解了重複內容或不正確的規範標籤如何導致 Google 緩存顯示錯誤的頁面。 正如您可能想像的那樣,這限制了查看特定網頁緩存的有用性。
某些頁面未緩存
這可能會讓人感到意外,但事實證明,許多頁面根本沒有被緩存。
需要為您的 WordPress 網站提供快速、可靠且完全安全的託管服務? Kinsta 提供所有這些以及來自 WordPress 專家的 24/7 世界級支持。 查看我們的計劃
一個普遍的誤解是,未緩存的網站意味著谷歌認為它不是必需的,但這不一定是真的。 接下來,我們將看看頁面可能沒有被緩存的一些原因。
為什麼我找不到我的緩存網頁?
並非所有已爬網的頁面都被緩存。 如果您的頁面沒有緩存版本,請不要驚慌! 這並不意味著您的頁面沒有被索引。
如果您擔心它確實沒有被索引,您可以使用 Google Search Console 的 URL Inspector 進行檢查。
為了證明索引頁面並不總是被緩存,我們回到 Google 的 John Mueller。 在 Twitter 上,他回復了一位詢問未緩存頁面的用戶:
“我們不會緩存我們索引的所有頁面,因此可能會發生這種情況。 有時需要一段時間,有時我們根本不緩存它。”
當用戶問他未緩存的網站是否總是低質量時,他說:
“那個+它可以是各種奇怪的技術怪癖的頁面。 緩存有點獨立,所以它並不代表我們的索引和排名。”
換句話說,緩存頁面不是排名因素。 即使您的網頁沒有緩存版本,您也可以將其置於搜索結果的頂部。
但是一個未緩存的頁面仍然可能值得研究。 您可以探索幾種不同的可能性。
您的頁面是基於 JavaScript 的
谷歌索引一些 JavaScript 驅動的頁面比其他頁面更容易。 但是許多 JavaScript 頁面最終沒有緩存,甚至沒有索引。
這是因為大多數 HTML 直到 JavaScript 執行後才被加載。 如果沒有可索引的內容,Google 將不會創建緩存頁面。
元標記防止緩存
頁面 HTML 代碼中的noindex
元標記意味著該頁面無法被 Google 索引,而noarchive
阻止它被緩存。 任何一個都將導致未緩存的頁面。
也許這正是你想要的。 但是,如果您沒有意識到頁面上有noindex
或noarchive
標籤,刪除它可以解決您丟失緩存的問題。
該頁面是重複的(或 Google 認為是重複的)
如果 Google 認定您的兩個網頁重複,請設法使它們獨一無二。 考慮每個頁面的不同搜索意圖。
如何解決網站緩存頁面的問題
您的頁面不必被緩存,但如果您想實現它,您可以做一些事情。
將您的頁面提交給 Google
如果您擔心 Google 根本沒有將您的頁面編入索引,您可以查看 Google Search Console。
在 Search Console 頂部的 URL 檢查搜索欄中輸入頁面的 URL。 如果您得到“URL 在 Google 上”的結果,則該頁面已被編入索引。 如果頁面最近發生了變化,並且您認為 Google 沒有為新版本編制索引,您可以單擊請求索引請求 Google 重新索引它。
您可能還會得到“頁面不在 Google 上”的結果。 如果這樣做,請向下滾動,您將能夠看到有關該頁面的一些詳細信息。 例如,您可以檢查該頁面是否允許抓取,以及用戶選擇的規範是否與 Google 選擇的規範相匹配。 要請求索引,請單擊請求索引:
檢查常見的站點問題
我們已經介紹了您的頁面可能沒有被緩存的幾個原因,例如大量的 JavaScript 和重複的內容。
除此之外,鼓勵頻繁索引的最佳方法是創建一個高質量的站點。 確保您已經針對移動設備優化了您的網站,並且您的網站速度很高。
如果您的頁面加載時間太慢,它甚至會減慢 Google 的機器人,從而導致索引延遲。
如何從谷歌緩存中刪除頁面
我們認為 Google 緩存非常有用,但出於各種原因,您可能不希望將舊版本的網頁存儲在 Google 的服務器上。 例如,您可能不希望停產產品的頁面可用。
防止頁面緩存的一種方法是使用上面提到的noindex
和noarchive
標記。 如果您想保留頁面但不希望它們被緩存,這些標籤是理想的永久解決方案。
您也可以直接要求 Google 從 Google 緩存中刪除 URL。 為此,請轉到 Google Search Console 並單擊側欄中的刪除。 然後單擊新請求。 此時,您有兩個選擇: Temporarily Remove URL和Clear Cached URL 。
臨時刪除意味著該網址在大約六個月內不會出現在 Google 搜索結果中。 緩存也會消失。 當頁面再次上線時,頁面將被重新索引並重新緩存(如果您不希望這種情況發生,則必須添加元標記)。
清除緩存的 URL 正是它聽起來的樣子。 緩存會被移除,但是當網站被爬取時頁面會再次被緩存。
如果您希望更新頁面的舊版本消失,這是一個很好的方法。 您還可以在更改頁面後提交頁面以供索引,從而推動 Google 更新頁面的緩存。
概括
谷歌緩存並不是傳聞中的一切。 您不能使用它來檢查您的網站上次被抓取的時間——擁有它並不會提高您的搜索引擎排名。 有時,它存儲的您網站的版本很奇怪、不完整或完全錯誤。
但谷歌緩存對網站所有者有其用途。 這是檢查您的網站如何被索引的快速方法,它可以幫助您發現和診斷問題。 您還可以使用 Google Search Console 來提高您的搜索引擎排名。
您對 Google Cache 有任何疑問嗎? 在評論部分讓我們知道——我們想听聽他們的聲音!