我预见到的一个错误是认为语义搜索仅涉及结构化数据。
这与人们在国际 SEO 中犯的错误相同,将其简化为仅使用 hreflang。
事实上,语义是从网站的基础上就存在的,可以在以下位置找到:
它的代码,特别是 HTML;
它的架构。
超文本标记语言
单击以在新选项卡中打开更大的版本
从一开始,HTML 就包含语义标记(例如:标题、H1、H2…)。
其最新版本 HTML5 添加了新的语义元素,其目的是在语义上组织 Web 文档的结构,正如 W3C 所说,允许“数据在应用程序、企业和社区之间共享和重用”。
Google 如何使用 HTML 语义元素的一个明显例子是其精选片段或答案框。
正如 Google 本身所声明的那样
(“我们不使用结构化数据来创建特色片段”),并且由Pete 博士、Richard Baxter和最近的Simon Penson很好地解释,倾向于用于答案框的文档通常显示这三个因素:
对于拉出答案框的查询,它们已经排名第一页;
他们使用基本的页面因素积极回答;
他们有干净的——或者几乎干净的——HTML 代码
结论是,语义搜索从代码开始,我们应该更多地关注那些“无聊”、耗时、不重要的 W3C 错误报告。
建筑学
作为符号学家(我在大学里与 巴林手机号码列表 翁贝托·艾柯(Umberto Eco)等人一起学习符号学和语言哲学),我情不自禁地不将信息架构本身视为语义学。
让我解释。
一切都始于正确的本体论
本体论是一个主题领域(或领域)中的一组概念和类别,显示它们的属性以及它们之间的关系。
如果我们以S站为例,我们可以在主菜单中看到星球大战主题区域中的概念:
本体论导致分类学(因为一切都可以分类)
如果我们查看 Starwars.com,我们会发现星球大战领 美国DJ 域中包含的每个概念都有自己的分类法。
例如,数据库提供了几个类别,例如:
人物;
生物;
地点;
汽车;
等等等等。
然后,本体论和分类学导致了上下文
如果我们想到塔图因,我们往往会想到卢克·天行者年轻时生活过的星球。
然而,如果我们访问一个有关深空探索的网站,塔图因将是天文学家在过去几年发现的众多系外行星之一。