Google的网络爬虫不断在互联网上搜索新的和更新的网页。
当这些爬虫为站点的内容编制索引时,它们不仅仅使用该信息来提供搜索结果。他们备份页面并将它们添加到名为 Google Cache 的统一数据库中。
您可能已经使用 Google 缓存查看已关闭或未正确加载的旧版本网站。但是您知道您也可以使用它来解决您网站上的问题吗?它甚至可以帮助您进行SEO工作。
本文介绍了Google Cache及其检查方法。我们还将了解Google缓存如何提供帮助 – 以及何时不应过分依赖它。
- Web缓存查看器扩展程序允许您右键单击任何链接以查看页面的Google缓存版本和Google Cache Checker可让您一次查看最多五个页面缓存的URL和日期:
谷歌缓存检查器
使用Google缓存查看页面的旧版本
您的页面说它是昨天缓存的,但您想查看上周的版本。谷歌缓存可以吗?
抱歉不行。
Google只能向您显示缓存页面的一个版本。要查看以前的网站版本,您可以使用Wayback Machine之类的工具,这是过去网页版本的存档。
看看我们以前的样子!
Wayback Machine上的2016 闪电博网站。
使用Google缓存的原因
事实是,还有其他工具可用于完成以下所有工作——在许多情况下,是帮助主题中亲自告诉我们,他说:
一般来说,我们并不总是在每次抓取页面时更新缓存页面。特别是当页面没有显着变化时,我们可能会选择只保留 [原文如此] 上的旧日期。
这是一个专业提示:如果您正在寻找有关Google抓取您网站的频率、原因以及使用哪些漫游器的信息,请忘记缓存。该数据位于Google Search Console上。您可以在侧边栏中的“设置”下找到抓取报告。
但是,您只能在域级别查看此信息。Search Console不会告诉您每个页面的抓取频率。
页面可能无法正确呈现
幸运的是,在这方面已经取得了一些进展。Google的Web Rendering Service用于在Web上呈现实时页面,它曾经基于过时的Chrome版本。因此,最新的浏览器有时呈现缓存页面的方式与Google呈现的当前页面不同。
自2019年以来,Google Web Rendering Service使用最新版本的Chrome。
但是,如果您的Chrome版本较旧,或者您使用的是其他浏览器,则缓存页面可能无法正确呈现。
另一个渲染问题与在Twitter上,他回答了一位用户询问未缓存页面的问题:
我们不会缓存我们索引的所有页面,所以这可能会发生。有时需要一段时间,有时我们根本不缓存它。
当用户问他未缓存的网站是否总是低质量时,他说:
它可以是各种奇怪的技术怪癖的页面。缓存有点独立,所以它不代表我们索引和排名的内容。
换句话说,缓存页面不是排名因素。即使您的网页没有缓存版本,您也可以将其置于搜索结果的顶部。
但是未缓存的页面仍然值得研究。您可以探索几种不同的可能性。
您的页面是基于JavaScript的
与其他网页相比,Google可以更轻松地为某些基于JavaScript的网页编制索引。但是许多JavaScript页面最终都没有缓存,甚至没有索引。
这是因为大多数HTML直到JavaScript执行后才会加载。如果没有可索引的内容,Google将不会创建缓存页面。
元标记阻止缓存
在你的网页的HTML代码元标记
noindex
是指页面无法通过谷歌进行索引,另外noarchive
也会阻止谷歌缓存阻止它。任何一个都将导致页面不被谷歌缓存。也许这正是你想要的。但是如果您没有意识到页面上有一个
noindex
ornoarchive
标记,删除它可以解决您的缓存丢失问题。该页面是重复的(或谷歌认为是)
如果Google确定您的两个页面是重复的,请想办法使它们独一无二。考虑每个页面的不同搜索意图。
如何解决网站缓存页面的问题
您的页面不必被缓存,但如果您想实现它,您可以做一些事情。
将您的页面提交给Google
如果您担心Google根本没有将您的网页编入索引,您可以查看Google Search Console。
在Search Console顶部的 URL 检查搜索栏中输入页面的URL。如果是“URL is on Google”的结果,则该页面已被编入索引。如果该页面最近发生了变化,并且您认为Google未将新版本编入索引,则可以单击请求编入索引,请求Google对其重新编入索引。
您可能还会得到“Page is not on Google”的结果。如果这样做,请向下滚动,您将能够看到有关该页面的一些详细信息。例如,您可以检查该页面是否允许抓取以及用户选择的规范是否与Google选择的规范相匹配。要请求索引,请单击请求索引:
Google Search Console-URL索引请求
如果你希望您的网站页面URL可以主动提交至Google Search Console,请求编入索引,您可以安装搜索推送插件来实现。
检查常见站点问题
我们已经介绍了您的页面可能不会被缓存的几个原因,例如大量JavaScript和重复的内容。
除此之外,鼓励频繁索引的最好办法就是创建一个高质量的站点。确保您已针对移动设备优化了您的网站,并且您的网站速度很高。
如果您的页面加载时间太慢,它甚至会减慢Google的漫游器速度,从而导致索引延迟。
如何从Google缓存中删除页面
我们认为Google缓存非常有用,但出于各种原因,您可能不希望将旧版本的网页存储在Google的服务器上。例如,您可能不希望停产产品的页面可用。
防止页面缓存的一种方法是使用上面提到的
noindex
和noarchive
标签。如果您想保留页面但从不希望它们被缓存,这些标签是理想的永久解决方案。您也可以直接要求Google从Google缓存中删除网址。要做到这一点,去谷歌搜索控制台,并单击侧边栏的删除。然后单击新要求。此时,您有两个选项:暂时删除网址和清除缓存的网址。
临时删除意味着该网址在大约六个月内不会出现在Google搜索结果中。缓存也会消失。该页面将在再次上线时重新索引并重新缓存(如果您不希望发生这种情况,则必须添加元标记)。
清除缓存的URL正是它听起来的样子。缓存会被移除,但是当网站被抓取时页面会被再次缓存。
如果您希望更新页面的旧版本消失,这是一个很好的方法。您还可以通过在更改页面后提交用于索引的页面来推动Google更新页面的缓存。
小结
谷歌缓存并不是传闻中的一切。你不能用它来检查你的网站上次被抓取的时间——拥有它不会提高你的搜索引擎排名。有时,它存储的网站版本很奇怪、不完整或完全错误。
但谷歌缓存对网站所有者有其用处。这是检查您的网站是如何编入索引的一种快速方法,它可以帮助您发现和诊断问题。您还可以使用Google Search Console来提高您的搜索引擎排名。