SEO中的实体:作者:Andrei Prakharevich它们已经存在多年,影响了搜索的许多方面,但很少被谈论。我猜部分原因是关于实体的可靠信息不多,众所周知模棱两可的谷歌专利也没有多大帮助。但另一部分是,即使你了解实体,也不清楚它们是否可以用于SEO。在这篇文章中,我收集了我们所拥有的关于实体的少量信息,并尽我所能将其从专利语言翻译成人类语言。在这一过程中,我发现了一些SEO策略。什么是实体?让我们转到谷歌的一个专利来了解实体的官方定义:
实体是一个单一的、惟一的、定义良好的和可区分的事物或概念。例如,一个实体可以是一个人、地点、项目、想法、抽象概念、具体元素、其他合适的东西或它们的任何组合。一般来说,实体包括用名词在语言学上表示的事物或概念。例如,颜色“蓝色”、城市“旧金山”和想象中的动物“独角兽”都可能是实体。
用更少的话来说,实体是任何值得注意的东西,用户可以根据名称搜索它。例如,我还没有足够的知名度(到目前为止)成为一个实体——我只是SEO主题的众多作者之一,没有人搜索我的名字。但是以Bill Slawski为例——他是一个被广泛认可的谷歌专利专家,通过在网络上被链接、提及和采访而获得实体地位。谷歌如何查找实体?
谷歌正在使用两个不同的过程构建其实体数据库:复制现有实体和发现新实体。
目前,谷歌主要是从现有的知识库(如Wikipedia和IMDb)复制其实体。它允许谷歌快速增长自己的数据库,但要保持它的完整性,因为他们只从少数可信的来源提取数据。缺点是,这些知识库在包含新实体和更新旧实体方面可能很慢,因此谷歌有不能提供最相关内容的风险。为了解决这个问题,谷歌申请了一些方法的专利,用于从web上可用的非结构化数据中发现新实体。一种方法建议使用已知的实体来查看它们是否连接到任何未知的实体,无论是通过语法还是通过频繁地出现在同一个文档中。例如,如果许多文档说“Andrei Prakharevich是Link Assistant的一个作者”,这是一个已知的实体,那么谷歌最终可能会怀疑Andrei Prakharevich是否可能是一个实体。另一种方法建议根据其字段的大小来衡量实体的值,即在窄字段中比在宽字段中更容易成为显著的实体。例如,对于一个作家来说,要成为整个SEO领域内的一个实体是相当困难的,但要成为SEO的一个子类别内的一个实体就容易得多。就像比尔·斯拉斯基是专利界的,玛丽·海恩斯是质量评价者指南界的,布莱恩·迪恩是反向链接界的。谷歌如何存储实体?
谷歌维护一个不断增长的数据库,其中包含约50亿个实体和超过5000亿个实体属性。下表总结了谷歌收集的关于每个实体的信息类型:
数据类型示例注释名称加州化用谷歌自己的话来说,名称是实体的语言表示。但实体本身实际上存储为唯一ID↓实体ID XXXXXX01唯一ID帮助区分具有相同名称的实体。例如,电视剧《加州靡情》是《IDXXXXXX01》,而歌曲《加州靡情》是《IDXXXXXX02》。一个实体可以属于任意数量的类和子类。例如,加州靡情是一部电视剧,但它也是喜剧和戏剧。类本身通常是实体。日志属性2007年8月13日Ity可以有任意数量的属性。例如,2007年8月13日上映的《加州靡情》,有七季,由大卫·杜楚尼主演,在加州拍摄,烂番茄评分只有可怜的57%。属性本身通常是实体。关系释放方式关系是指一个实体与其他实体之间的连接方式。例如,《加州靡情》于2007年8月13日上映,播出了七季,由大卫·杜楚尼主演。相关性0.84相关性得分衡量实体之间关系的强度和/或重要性。例如,谷歌可能有0.99的信心认为《加州靡情》是一部电视剧,0.74的信心认为它是一部喜剧,0.36的信心认为它是一部戏剧。如果您像我一样是一个视觉学习者,那么实体数据库可能看起来类似于下面的方案,只是要复杂得多。在这个方案中,椭圆形表示实体,矩形表示关系,数字表示相关性得分:
如何检查某物是否为实体?最简单的方法是谷歌你的实体,看看它是否有专门的知识面板:
一种更复杂的方法是使用实体挖掘工具来获取谷歌认为与你的查询匹配的所有实体的列表。如果我们以Mick Jagger为例,那么谷歌认为有40个实体与查询有一定的相关性,但是Mick Jagger自己以9747的最高相关性得分胜出,而最接近的竞争者是Bianca Jagger,其相关性得分为3055。该工具还告诉我们实体的类型,比如事物、人、组织等等。
检查某物是否为实体的最高级方法是找到源代码,使用谷歌的知识图搜索API查看实体背后的代码。这种方法没有任何好处,因为它不太友好,而且它提供的唯一额外信息是实体ID。但是,如果上面的工具停止工作,您总是可以使用以下方法:{”结果”:{“描述”:“歌手”,”图像”:{:“url https://pt.m.wikipedia.org/wiki/Ficheiro Mick_Jagger_Deauville_2014.jpg”,:“contentUrl https://encrypted-tbn1.gstatic.com/images?q=tbn ANd9GcQWKDS8YTwb0wu7sRIN4P_IblmoYNW1NVbnIxWgGQ-rhhlylU7H”},“@type”:(“事”,“人”,“组织”),“@ id”:“公斤:/ m / 01 kx_81”,” detailedDescription “: {“articleBody”: “迈克尔·菲利普·贾格尔爵士是英国歌手、词曲作者、演员和电影制片人。他作为滚石乐队的主唱和创始人之一而享誉世界。”,“url”:“https://en.wikipedia.org/wiki/Mick_Jagger”,“许可证”:“https://en.wikipedia.org/wiki/Wikipedia Text_of_Creative_Commons_Attribution-ShareAlike_3.0_Unported_License”},“名称”:“米克·贾格尔”,“url”:“http://www.mickjagger.com/”},“resultScore”:9747.802734375,:“@type EntitySearchResult”},谷歌如何使用实体?
只要有一个包含实体的搜索查询,谷歌就会使用它的实体数据库来增强搜索结果。最值得注意的是,谷歌使用实体来添加知识面板、提供搜索建议和提高所服务页面的相关性。知识面板知识面板就像放置在搜索结果页面上的极简引用。除了实体的名称、图像和描述之外,面板通常还包括一些最重要的实体属性,这些属性根据实体的类型而不同:
SERP建议
因为谷歌知道实体的类,所以它可以对来自同一类的其他实体提出建议。例如,如果我正在搜索Arc’teryx,谷歌会将其识别为一个外套品牌,并询问我是否想查看其他外套品牌,如Patagonia和The North Face:
使用相同的逻辑,我现在可以搜索整个实体类别,并在搜索中看到一些建议。例如,如果我搜索最好的动作片,谷歌提供了一系列分类为动作片的实体供选择:
页面排名
也许最重要的是,实体允许谷歌降低关键词和链接作为排名信号的影响,而是关注内容的含义。它能做的是映射一个内容片段中的实体,并查看该映射是否有意义,是否所有预期的实体都存在并相互连接。例如,如果我正在写一篇关于谷歌专利的文章,那么谷歌可能希望我提到专利专家Bill Slawski,以及申请专利的美国专利和商标局(United States Patent and Trademark Office)。从理论上讲,在正确的上下文中使用了所有正确实体的页面将排在没有使用这些实体的页面之上。
如何使用实体进行SEO?
预计实体将很快完成反向链接和关键字的工作。也许不是全部,但可能是大部分。排名系统将变得更加难以控制,因为谷歌将能够分析比过去多得多的上下文——任何不自然的位置都不会飞起来。为此,如果你想在未来证明你的SEO策略,你必须开始建立你自己的实体,并加强与你的领域内其他实体的联系。在谷歌知识图谱中添加您自己的实体将是您的SEO策略的一个不可思议的资产。在你的业务中所有的东西中,你的品牌可能是最容易转化为实体的(除非你的团队中有一些名人)。确保通过搜索引擎优化和营销技术来提高你的品牌知名度。要有一个独特的品牌名称,有一个明确的定位(例如,Arc’teryx是一家专门生产外套的服装公司),要与你的品牌属性保持一致(地点、创建日期、创建人等),创建和维护社交档案,在服务于你的市场的关键商业目录中创建一些清单,推广你的品牌,并确保在你的领域的其他实体中被提及(没有链接也很好!)如果你不想等待谷歌在你的网站上查找实体,你可以通过使用结构化数据来加快速度。它提供了一个巨大的标记库,可用于告诉谷歌内容的哪些位是实体,哪些是实体属性。具体来说,本地业务模式可用于将您的业务与附近的地理实体绑定,并提高您在本地搜索中的突出位置。组织、人员和作者标记可以进一步用于在您的网站上的实体和它们在其他网站上的概要文件之间创建连接。
提示!想尝试使用Schema吗?让我们用我们最近的结构化数据指南为您介绍一下!申请你的GMB资料
Clai明、优化和维护你的谷歌我的业务(GMB)清单是任何本地SEO策略中最重要的部分。它并不一定会把你的企业变成一个实体,但它会让你到达那里的大部分道路。
谷歌将使用您的列表了解有关您的企业的可靠信息,并在您的企业和其他本地实体之间建立联系,它将为您的本地排名创造奇迹。因此,这种效果与成为实体非常相似,只是从技术上讲,本地业务数据库与知识图是分离的。
提示!使用我们最近的GMB指南中的提示,将您的清单推到最大!每当你计划一个新的内容片段时,确保它包括谷歌认为与你的主题相关的其他实体。下面是如何研究这些实体:
谷歌搜索
首先,我们知道谷歌使用实体关联来增强搜索结果。所以我们可以做的一件事是谷歌我们的内容的主题,看看什么样的实体建议出现在搜索中。例如,如果我计划写一篇关于男士羽绒服的文章,我会谷歌我的主题,并查看“人们也问”部分的相关问题:
然后滚动到SERP的底部,查看相关搜索:
然后切换到图像搜索,滚动到建议的搜索modifiers:
维基百科
我们知道谷歌使用维基百科作为其实体数据库的来源之一,因此,你也可以使用维基百科查找实体属性,并找到其他相关的实体。例如,如果我要写一篇关于米克·贾格的文章,维基百科会告诉我,如果不提到基思·理查兹,我就不能写:
“自然语言API”
最后一站是谷歌的自然语言API (NLP API)的演示——它用来处理文本和选出实体的技术。技术本身是付费的,但演示是免费的。你可以做的是复制你的竞争对手的排名靠前的内容,通过NLP API运行它,并发现内容中提到的最突出的实体,像这样:
该工具可能会为每一文本发现数百个实体,但只有少数会有显著性得分。从你的竞争对手中抓取一些最突出的实体,把它们添加到你从维基百科和谷歌搜索中得到的内容中,你就得到了一个实体的可靠列表,你可能想要包括在你的内容中。我喜欢把实体想象成现实世界的数字模型,我很好奇它在SEO方面的发展方向。也许这种模式会变得非常好,以至于我们不需要SEO来向搜索引擎解释我们的内容。或者,它可能会变得非常复杂,我们将不得不使用大量的结构化数据来帮助谷歌理解什么是什么。但无论走向哪一个方向,可以肯定的是,实体的重要性只会增长,那些今天开始使用它们的人注定会在长期中获胜。