Skip to content

谷歌SEO:如何查找和修复孤立页面

谷歌SEO:如何查找和修复孤立页面

当他们开始在历史悠久的网站上工作时,流沙等待毫无戒心的SEO。这些技术站点错误的坑,由几代以前的机构散布,减慢并阻碍了SEO的努力和进步。当您负责清理它时,找到快速修复是您的首要任务。因此,您可以从基本的站点审核开始,然后查看几个孤立页面。您可能听说过孤立页面对网站不利,但不完全了解它们是什么以及如何修复它们。

什么是孤立页面?

孤立页面是搜索引擎可能难以发现的页面,因为它们没有来自您网站其他地方的内部链接。这些URL往往会落空,因为搜索引擎爬虫只能从站点地图文件或外部反向链接中发现页面,而用户只有知道URL才能访问该页面。

什么导致孤立页面?

通常,孤立页面是偶然的,并且由于各种原因而发生。最常见的原因是没有用于站点迁移、导航更改、站点重新设计、缺货产品、测试或开发页面的流程。孤立页面也可能是有意的,例如促销和付费广告登陆页面,或者您不希望页面成为用户旅程一部分的任何情况。

为什么孤立页面对SEO不利?

搜索引擎很难找到孤立页面,因为它们使用链接来帮助发现新内容并了解页面的重要性。这是谷歌所说的:

谷歌使用称为爬虫的自动化程序搜索网络,寻找新的或更新的页面。我们通过许多不同的方法查找页面,但主要方法是跟踪我们已经知道的页面的链接。

例如,假设您发布了一个新网页,但忘记从您网站的其他地方链接到它。如果该页面不在您的站点地图中并且没有反向链接,Google将不会找到或索引它。那是因为他们的网络爬虫不知道它的存在。更糟糕的是,该页面无法获得PageRank。一般来说,PageRank是谷歌通过计算一个页面获得的“票数”来理解页面重要性的方式。

如何查找孤立页面?

要在您的网站上查找孤立页面,您需要将可抓取的URL列表(Google可以找到的)与人们在您网站上点击的URL列表进行比较。这听起来很技术性,但不要气馁。我们使用您熟悉的工具将如何查找孤立页面分解为三个简单的步骤。

1.查找可抓取的URL

您可以使用许多工具来收集所有可抓取URL的列表。我们通常使用Ahrefs的站点审核,因为它通过Ahrefs网站管理员工具帐户完全免费,并且您可以选择使用外部反向链接作为查找更多URL的来源。这是如何做到的:

·前往现场审核。

·单击+新建项目。

·单击URL源选项卡并选中反向链接作为URL源以及默认设置。

·单击继续,按照说明完成设置,然后运行爬网。

反向链接数据对于查找孤立页面很有用,因为它将来自Ahrefs链接索引的URL混合在一起。如果页面没有任何内部链接,则基本爬虫将找不到它。但是,如果一个页面有反向链接,Ahrefs会在您的网站上找到该URL,并且知道爬网没有找到内部链接,因此它一定是孤立页面。站点审核完成后,从页面资源管理器中导出所有内部页面并保存。您将在第3步中使用它。

2.查找有点击的网址

下一步是获取在我们网站上点击的所有URL的列表。有很多方法可以做到这一点,最好使用尽可能多的数据源。如果您有权访问,则日志文件可以正常工作,因为它们是更准确的服务器端数据。我们不会深入了解如何访问这些内容,因为这取决于服务器的设置方式。但如果你选择走这条路,这里有三种常见服务器类型的官方指南:

·访问Apache日志文件(Linux)

·访问NGINX日志文件(Linux)

·访问IIS日志文件(Windows)

在本文中,我们将使用Google Analytics(GA4)和Google Search Console,因为每个人的过程基本相同。以下是在Google Analytics(GA4)中查找具有命中的URL的方法:

·登录到您的数据洞察帐户

·开始一个新的空白报告

·连接Google Analytics作为您的数据源

·选择您正在分析的帐户>选择GA4媒体资源

·在您的报告中添加一个基本表格

·将数据源设置为在步骤4中创建的GA4属性

·将维度设置为页面路径

·将指标设置为视图

·按视图降序排序

·将默认日期范围设置为在网站上安装GA4之前

要从表格中导出结果,请单击右上角的三个垂直点,然后点击导出。使用有用的名称保存,例如“date_GA_URLs_people_are_hitting_brandname”,因为稍后您将再次需要它。因为我们导出了页面路径而不是完整的页面URL,所以我们需要将域添加到电子表格中所有单元格的开头。这在Google表格中很容易。只需将CSV导入空白表,在左侧插入一个新列,然后将此公式粘贴到单元格A1中(确保将example.com替换为您的域):

=IFERROR(ARRAYFORMULA(IF(ISBLANK(B:B),””,IF(B:B=”Page Path”,””,IF(B:B=”(not set)”,””,”https://example.com”&B:B)))))

由于多个URL来源总是最好的,我们还将从Google Search Console(GSC)中提取数据。GSC将导出限制为前1,000个URL,但Google Data Studio有一个巧妙的小技巧,可以让您提取更多。你可以尝试这么做:

·重新打开您的数据洞察报告。

·开始一个新页面(command+M)。

·打开资源>管理添加的数据源。

·单击添加数据源。

·选择搜索控制台。

·选择您正在分析的网站>URL展示>网络。

·在您的报告中添加一个基本表格。

·将维度设置为着陆页。

·将指标设置为展示次数。

·将每页的行数扩展到5,000。

·编辑日期范围以至少查看过去三个月。

·从表中导出结果。

·将您的工作表命名为“日期GSC_URLs_people_are_hitting_brandname”之类的有用名称,因为稍后您将再次需要它。

现在,将人们从您的不同来源访问的所有URL合并到一个电子表格中,并通过删除重复项来清理数据。

3.交叉引用两个URL源

最后一步是交叉引用可抓取的URL(来自Ahrefs的Site Audit)和具有命中的URL(来自GA和GSC)。为此,请创建一个空白Google表格并创建三个选项卡。将它们标记为爬网、点击和交叉引用。在第一张表中,从Ahrefs的站点审核中抓取、复制和粘贴所有可抓取的URL。

要找到这些,请打开从第1步导出的CSV并过滤传入AllLinks等于零的结果。这非常重要,因为这些是孤立页面,因此将它们包含在“爬网”选项卡中会导致交叉引用时结果不准确。相反,您应该复制这些URL并将它们添加到“点击”选项卡中。接下来,将Ahrefs导出中的剩余URL复制并粘贴到Google表格的抓取标签中。

在第二张表中,点击,复制/粘贴第2步中的所有URL。这些是您使用Google Analytics、Google Search Console或您的站点日志文件找到的页面。它包括用户访问过的网页。在第三张表中,交叉引用,在第一个单元格中输入以下函数:

=UNIQUE(FILTER(hits!A:A,ISNA(MATCH(hits!A:A,crawl!A:A,0))))

点击进入。该功能将自动拉取所有孤立页面,以便于分析。

如何修复孤立页面?

营销人员经常犯的错误是简单地将内部链接添加到所有孤儿页面。这种方法的主要问题是,仅仅因为可以在所有页面上应用快速修复并不意味着它应该是。一些孤立页面是有意的,如PPC登录页面,而其他页面则可以被删除,如测试页面。我们不想浪费资源来修复没有损坏或不太可能产生积极影响的东西。

如果在站点迁移期间丢失了一个页面,并且该页面对访问者没有任何价值,那么删除它可能是最好的选择。但是,如果页面有反向链接,也可能值得将URL重定向到另一个相关页面以保持反向链接的公平性。让我们看看修复孤立页面的四种策略。

1.内部链接

对网站访问者有价值的孤立页面应合并到您网站的内部链接结构中,以使访问者和搜索引擎更容易找到它们。例如,假设在网站迁移或重新设计期间忘记了一篇文章。我们需要从我们知道谷歌很快(重新)抓取的相关页面内部链接到它。这是在Ahrefs中执行此操作的简单方法:

·前往现场审核

·打开您网站的最新抓取

·在工具>打开页面资源管理器下

·在页面文本中搜索单词或短语

·按自然流量对结果进行排序

2.无索引

有意不在内部链接的孤立页面(例如广告的登录页面)不应编入索引,以防止它们出现在自然搜索结果中。大多数SEO插件使这变得像选中一个框一样简单,但您也可以通过将其复制并粘贴到页面的

部分来手动完成:

确保这些页面在robots.txt中仍然可以抓取。否则,搜索引擎将看不到noindex指令。

3.合并

合并与另一个页面具有相同或相似内容的孤立页面。这意味着合并内容并将孤立URL重定向到其他页面。例如,假设您有相同产品的两个产品列表。其中之一是孤立页面;另一个不是。您应该从孤立页面获取任何唯一有价值的信息并将其添加到另一个页面,然后再将孤立页面重定向到那里。

4.删除

应该删除对访问者没有价值且没有其他目的(例如付费流量活动)的孤立页面。例如,可以删除未使用的CMS主题页面。这将导致出现404页面,并且随着时间的推移自然会退出搜索结果。如果页面有反向链接,您可能希望将URL重定向到另一个相关页面,以在删除后保留链接公平性。

如何防止孤立页面?

如您所见,审核孤立页面非常耗时。因此,一旦您投入工作,您就希望将来防止出现孤立页面。以下是一些需要考虑的政策和程序。

1.制定网站迁移计划

任何时候进行网站迁移时都要制定计划,积极主动。您可以通过使用301重定向将旧页面重定向到新版本来避免网站上的链接断开和混乱。

2.设置您的网站结构以获得成功

如果您必须手动在内部链接到新页面,您一定会错过一些并最终得到孤立页面。这就是为什么您应该选择为您处理内部链接的网站结构。大多数类型的CMS都是开箱即用的。例如,每次我们发布新的博客文章时,WordPress都会从我们的博客主页和存档中添加一个内部链接。但是,如果您使用的是自定义解决方案,则需要确保为良好的网站结构准备了必要的代码。

3.正确移除停产产品

如果您经营一个电子商务网站,您应该从目录中删除停产产品(以及指向它们的所有内部链接)并设置状态代码404或410。未能删除此类产品的内部链接是常见原因孤立页面。如果页面有很好的反向链接,并且产品有更新或改进的版本,您可能需要考虑保留页面以保留反向链接权益。为此,请更新页面内容以解释产品不再可用的原因,包括介绍新的设计功能和链接到新产品页面。这样,用户就不会登陆完全不相关的页面或404。

4.定期进行现场审核

通过每月运行审核,您可以随时掌握任何可能从裂缝中溜走的意外孤立页面。您可以使用Ahrefs的站点审核中的调度功能轻松完成此操作。

写在最后

查看成排的孤立页面错误并试图理解沉重的技术术语是令人生畏的。虽然查找和修复孤立页面需要大量时间,但并不需要很辛苦。

相关推荐: 铺货卖家 | 他仅用2个月,月均单量从600单涨到1500单!

跨境圈有很多玩法,只是你还没发现,也可能你已经知道,但你害怕去尝试,比如说无库存铺货模式! 一位易仓卖家客户在短短2个月内,通过无库存铺货模式,月均单量从600多单增长到1500多单,真的超棒! 为什么无库存铺货模式这么强大?是爱吗?是魔力吗?是因为用了易仓软…

    码刀科技(www.lekshop.cn)是国内知名企业级电商平台提供商,为企业级商家提供最佳的电商平台搭建(多种模式电商平台搭建:B2B/B2B2C/B2C/O2O/新零售/跨境等)、平台管理系统开发及互联网采购解决方案服务, 联系客服了解更多.

    电子商务网站建设的重要性和好处