如何测试和验证结构化数据
根据 Schema.org 规范和 Google 的搜索功能要求审核和验证结构化数据,以启用特殊的搜索结果功能。
使用 SEO Spider 工具进行结构化数据测试
结构化数据为搜索引擎提供了关于页面及其组件含义的明确线索,并可以在 Google 中启用特殊的搜索结果功能和增强功能。
不同的 Google“富结果”搜索功能需要不同类型的结构化数据,实施它们可以帮助获得富摘要(搜索结果中更突出、更详细的“摘要”),这可能会带来更多流量。
Google 的结构化数据测试工具可以帮助审查和验证结构化数据的实施,以满足其富结果功能的要求。 遗憾的是,它没有 API,不允许批量审核 URL,有时会遗漏或错误分类所需属性和推荐属性之间的验证问题。
Google 也在努力开发富结果报告,以帮助监控 Search Console 中的验证,尽管它们尚未支持所有富结果功能。
考虑到以上因素,我们的团队在 Screaming Frog SEO Spider 中构建了自己的结构化数据验证器,以帮助提高审核过程的效率和规模。
本教程将引导您了解如何使用该工具根据 Schema.org 规范和 Google 的 富结果功能 要求审核和验证结构化数据。
要开始使用,您需要下载 SEO Spider,拥有 付费许可证,然后按照以下步骤操作。
1) 在“Configuration > Spider > Extraction”下启用结构化数据选项
勾选“JSON-LD”、“Microdata”、“RDFa”、“Schema.org Validation”和“Google Rich Result Feature Validation”。

虽然 Schema.org 词汇区分大小写(您可以启用此选项),但 Google 并没有那么严格——因此对于 Google 富结果功能及其对结构化数据的理解来说,这不是必需的。
2) 抓取网站
打开 SEO Spider,在“Enter URL to spider”框中键入或复制您要抓取的网站,然后点击“Start”。

然后爬网将开始,结构化数据将从页面中提取并验证。 喝杯咖啡,等待进度条达到 100%,爬网完成。
3) 查看结构化数据选项卡
结构化数据选项卡 显示爬网中找到的所有 URL 以及单独对应列中的不同结构化数据类型,以及主窗口窗格中的总数、错误和警告。

结构化选项卡有 8 个过滤器,可帮助您了解结构化数据的实施并识别验证问题。“Total Types”和“Unique Types”列计算为每个 URL 发现的结构化数据 itemtypes 的数量。
右侧的概览窗口窗格提供了每个选项卡和过滤器中包含的数据的摘要,因此您知道在哪里单击,而无需检查每个过滤器以查看是否有数据。

您可以按以下内容进行过滤 -
- Contains Structured Data – 这些只是包含结构化数据的任何 URL。 您可以在上部窗口的列中看到不同的类型。
- Missing Structured Data – 这些是不包含任何结构化数据的 URL。
- Validation Errors – 这些是包含验证错误的 URL。 这些错误可以是 Schema.org、Google 富结果功能或两者兼有——具体取决于您的配置。 Schema.org 问题将始终被归类为错误,而不是警告。 Google 富结果功能验证将显示缺少必需属性或必需属性的实施问题的错误。 Google 的“必需属性”必须包含且有效,内容才有资格显示为富结果。
- Validation Warnings – 这些是包含 Google 富结果功能的验证警告的 URL。 这些将始终是“推荐属性”,而不是必需属性。 可以包含推荐属性以添加有关内容的更多信息,这可以提供更好的用户体验——但它们不会使您没有资格获得富摘要。 Schema.org 验证问题没有“警告”,但是使用较旧的 data-vocabulary.org 模式会发出警告。
- Parse Errors – 这些是结构化数据未能正确解析的 URL。 这通常是由于不正确的标记造成的。 如果您使用的是 Google 首选的 JSON-LD 格式,那么 JSON-LD Playground 是一个出色的工具,可以帮助调试解析错误。
- Microdata URLs – 这些是包含 microdata 格式的结构化数据的 URL。
- JSON-LD URLs – 这些是包含 JSON-LD 格式的结构化数据的 URL。
- RDFa URLs – 这些是包含 RDFa 格式的结构化数据的 URL。
4) 查看下部窗口窗格“结构化数据详细信息”选项卡以分析验证错误和警告
结构化数据详细信息下部窗口窗格提供有关发现的项目和问题的更多信息。 下部窗口窗格的左侧显示属性值和图标 ,当存在错误或警告时,右侧窗口提供有关特定验证问题的详细信息。

下部窗口窗格的右侧将详细说明确切的验证类型(Schema.org 或相关的 Google 富结果功能)、严重性(错误、警告或仅信息)以及要修复的特定问题的消息。 它还将提供指向特定 Schema.org 属性的链接,以提供有关要求的更多详细信息。
5) 参考 Schema.org 或 Google 富结果功能文档以更好地理解验证问题
即使在工具的帮助下,结构化数据也可能具有挑战性。 因此,请始终参考相关文档以提供更多上下文并遵循指南。
结构化数据审核的一个简单规则是修复验证错误以确保内容被视为 Google 富结果功能和富摘要,并考虑警告中的信息是否对用户有用,然后实施或忽略。
验证问题基于 Google 富结果功能 必需和推荐属性以及 Schema.org 规范。 验证也针对属性的值执行,以确保它们采用正确的形式。 例如,如果属性应该是 URL 或数字等。
查看 Google 富结果功能指南将更好地理解验证问题——因此请始终参考它们。 让我们看一些例子和这个过程。
Google 产品验证错误示例
在下面的示例中,我们可以看到 lv.com 具有“Google 产品”功能验证错误和警告。 右侧窗口窗格列出了那些必需的(带有错误)和推荐的(带有警告)。

您可能会争辩说不应该在此处使用“product”,但事实是,它将根据 Google 产品功能 指南进行验证,而根据 Google 文档,需要图像,并且缺少其他六个推荐属性。
可以实施突出显示为警告的推荐属性以添加有关内容的更多信息(这可能会提供更好的用户体验),或者只是忽略它们。
Google 公司联系人验证错误示例
在下面的下一个示例中,Direct Line 在“contactType”schema 属性中使用“customer service general enquiries”时,存在 Google 公司联系人功能 验证错误。

右侧窗口窗格解释说,“http://schema.org/contactType”需要是“customer service”、“customer support”、“technical support”、“billing support”、“bill payment”、“sales”、“reservations”、“credit card support”、“emergency”、“baggage tracking”、“roadside assistance”或“package tracking”在“ContactPoint”中。

如上所示,验证错误与 Google 文档中的要求相符。 但是,Google 结构化数据测试工具 没有将其作为验证错误来拾取。

虽然 Google 的工具可能不太严格或遗漏某些项目,但我们建议遵循指南,以便所有结构化数据都采用正确的格式,以确保它是机器可读的并且没有问题。