谷歌如何跟踪您所消费的媒体(以影响搜索结果)


图片来自Jason Briscoe on Unsplash

谷歌知道你在电视上看什么。它很可能听到你的收音机在播放。它知道你在Spotify上听什么,在Netflix上看什么。它有可能获取这些信息,并根据这些信息对你的搜索结果进行个性化设置。就像谷歌的专利“使用超高频音频在设备间通信信息”中描述的那样,当这种情况发生时,你甚至可能听不到设备之间的对话。几年前,我写了一篇关于谷歌媒体消费历史专利申请的文章,这篇文章让我对我的手机在一天中还接收和收听了什么东西产生了兴趣。这篇文章是关于一项名为“使用媒体消费历史查询响应”的专利。我想更深入地了解谷歌可能会如何处理这类信息,正是这种好奇心激发了我写这篇文章的灵感。

谷歌在前一年获得了一项关于你在电视上看什么被用作排名信号的专利,但媒体消费历史专利是不同的。谷歌已经获得了至少一项专利,该专利涉及从电视中提取音频,从而使它能够识别该电视的视图。我很好奇谷歌还会用这些信息做什么,并认为有必要看看其他可能相关的个人媒体消费历史专利。想象一下,如果能够执行这样的查询,例如查询响应专利:

,用户可以在设备上输入一个自然语言查询,例如口头查询,“我以前什么时候见过这个演员?”,同时观看特定内容,如电影《社交网络》。我发现的第一个相关专利提供了媒体消费历史可能包含的更多细节。它的灵感似乎来自于保留用户在订阅服务上的评分和评论记录,以防他们取消订阅这些服务,或者它可能会因某些原因被关闭:

个人媒体数据库

美国专利:9,043,340批准日期:2015年5月26日专利摘要为我们提供了关于

的概述。

是一种系统和计算机实现的方法,用于维护与用户帐户相关的个人媒体数据库,包括媒体相关信息,该方法包括从远程媒体服务接收有关媒体项目的媒体相关信息,其中媒体相关信息包括关于媒体项目的评级信息,所述评级信息表示用户对媒体项目质量的评估,以及根据第一评级标准提供的评级信息,所述第一评级标准指示媒体项目的评级方式,并根据个人媒体数据库中使用的第二评级标准转换评级信息,第二评级标准,指明媒体项目的评级方式,其中第二标准与第一标准不同,并将包括转换后的评级信息在内的媒体相关信息存储在个人媒体数据库中。

这听起来像是对那些可能对电影或歌曲感兴趣的人的一个周到的帮助,或者跟踪他们所观看或收听的内容,并可能进行评论。谷歌Now展示的是与你过去搜索过的东西有关的故事,以及你表示过的感兴趣的东西,例如涉及特定演员和音乐家的媒体。谷歌的搜索个性化方法是向搜索者显示他们认为权威的文档,以及从他们的搜索历史中反映他们兴趣的文档。将媒体消费历史添加到基于搜索历史的个性化是有意义的。它是在一定程度上抓住搜索者兴趣的信息。正如个人媒体数据库专利告诉我们的:

在这里所使用的“媒体相关信息”对应于所有与媒体项目消费相关的信息,包括消费历史、评级和评论,对应于各种类型的媒体,包括但不限于电影、电视节目、音乐、书籍和期刊。例如,与媒体相关的信息包括媒体评级信息。“评级信息”是指用户对某一媒体项目的评估或评价,包括但不限于这些信息(如价值、分数或其他指标)。评价可包括对媒体项目质量的评估,并可代表用户对媒体项目的质量、受欢迎程度和其他特征的意见。我遇到的下一个专利是讨论媒体消费历史,它关注的是这种历史可能如何影响我们看到的搜索结果。

确定媒体消费偏好

发明者:Martin Klara受托人:谷歌INC。摘要:

公开了用于确定媒体消费偏好的系统和方法。方法可以包括访问与用户关联的媒体消费历史记录。所述媒体消费历史可以包括用户的媒体购买历史、用户的媒体观看历史和用户的媒体收听历史中的至少一种。根据媒体消费历史,可以确定用户的媒体类别偏好。媒体类别偏好可包括针对媒体消费历史中媒体项目的多个媒体类别中的每一个的流行度指示。用户为响应搜索查询而提供的搜索结果和/或为用户准备的媒体推荐可根据媒体类别首选项进行评分。媒体可包括录像、电影、电视节目、书籍、录音、音乐专辑和/或其他类型的数字媒体。

这项专利不仅仅关注人们听什么、看什么,媒体消费的概念扩展到人们可能购买的内容。这项专利还将推荐系统引入到关于媒体消费历史的讨论中。它告诉我们如何使用这些历史记录来影响搜索结果:

本文描述的系统和方法可以分别用于提高由数字内容信息检索系统和推荐系统生成的检索搜索和推荐的质量。例如,偏好提取系统最初可能确定用户的类别/类型偏好和/或语言偏好(或与数字媒体消费相关的任何其他类型的偏好)。然后,提取的数据可用于信息检索和/或个性化推荐系统,以便对呈现给用户的结果进行个性化处理。

给出了一个示例搜索的上下文。搜索“免费游戏”的用户可能会被显示为“桌面游戏”,前提是他们过去曾购买过桌面游戏。如果搜索“动作片”的人表明除了动作片还喜欢浪漫电影,那么搜索结果可能会向他展示有浪漫元素的电影。搜索“外国电影”的人可能会看到俄罗斯电影,如果有过去的数字媒体购买俄语内容的历史。

已经有很多文章讨论了个性化搜索结果导致谷歌的过滤气泡。如果你被一个气泡包围,看到气泡中的倒影,无论你往哪里看,这些倒影都会告诉你你的兴趣所在。怎样才能避免这样的泡沫呢?会引入其他的在之前的搜索历史之外的影响,比如媒体消费历史,有助于避免这些过滤气泡?该专利告诉我们一个语言偏好提取模块,在该模块中,如果你用一种特定的语言购买书籍、杂志、看电影和听录音,这可能表明你对该语言媒体的偏好。类似于语言偏好,这个媒体消费偏好专利还提到了一个类别/类型偏好提取系统的例子。当涉及到数字媒体项目时,它可能包含一个人购买或观看历史的信息。如果有人将你在电视上看过的所有电影和电视节目,你读过的书籍和杂志,或者你听过的歌曲进行分类,并试图确定哪种类型或类别最受欢迎,这也可能影响搜索结果。我喜欢看恐怖电影,但不喜欢读恐怖书籍,这个偏好系统会理解不同媒体类别的类型偏好。

媒体中的实体

当谷歌在2012年引入知识图时,它开始为我们带来一种新的搜索方式,这种方式不太依赖于将查询中的关键字与在Web上找到的文档中的关键字进行匹配。我在《如何在搜索中使用知识库实体》一文中写过一项专利,该专利是关于如何从知识图中收集的信息的数据存储中直接回答搜索结果的。那篇文章中的一个例子是如何通过包含来自知识图的信息来回答一个关于电影的特定查询。问题是,“罗伯特·杜瓦尔说他喜欢哪部电影《清晨汽油弹的味道》?”提供答案的搜索结果并不是一个以文本为基础的问题答案的特色片段,相反,这些serp以电影《现代启示录》(Apocalypse Now)的几个视频开始,由罗伯特·杜瓦尔(Robert Duvall)发表声明。

有一个媒体消费历史专利,它可以了解您可能看过或听过的实体,并可以回答有关它们的查询。该专利是:

显示媒体内容项目

的摘要发明者:Ant Oztaskent, Yaroslav Volovich和Ingrid McAulay Trollope收让人:谷歌INC。

Abstract

一种在服务器系统中的方法包括:检测媒体内容项的表示,识别媒体内容项和与媒体内容项相关的一个或多个实体,基于一个或多个信号确定所标识的实体的各自感兴趣级别,基于所确定的感兴趣级别选择实体的一个子集,并发送到用户的客户端设备,以便在客户端设备上显示所选实体的子集。

如果有办法从诸如知识图谱之类的来源获取信息,为什么要为您所消费的媒体申请专利呢?和许多专利一样,这项专利首先描述了它设计时要解决的问题。它直接告诉我们:

用户通常想要的内容,如与他们正在观看的视频内容相关的信息,或与他们可能感兴趣的视频内容相关的信息,如与视频内容中的口语对话相关的信息或视频内容中出现的人的信息。通常情况下,为了获得与视频内容相关的信息,用户需要使用具有互联网功能的设备访问网站。现有的为用户提供视频内容相关信息的方法效率低下,因为它们要求用户采取一些观看体验之外的操作。此外,在这些现有的方法中,所找到的信息可能以一种不利于理解或后续跟进的方式呈现。询问出现在视频中的实体是很有趣的,比如这两个:

专利告诉我们关于

服务器106包括实体数据库或存储库122。实体数据库122是一个与视频内容相关的实体数据库。在这里,实体是任何与视频内容相关的明显存在或事物。在某些实现中,实体包括但不限于标题、人物、地点、音乐、事物、产品、报价和奖项。例如,标题包括电影标题、系列标题(如电视连续剧标题)和集标题(如电视连续剧标题)。这些人包括演员(如演员)、工作人员(如导演、制作人、作曲家等)、故事中的角色、竞赛选手、竞赛评委、主持人、嘉宾和提到的人。地点包括故事中的地点、拍摄地点和提到的地点。音乐包括视频内容中使用的歌曲和作曲。这包括故事中的对象(如《星球大战》中的光剑)。产品包括视频内容中提到或显示的任何商品、服务或项目(例如,提到的书籍,由于植入广告而出现在视频内容中的产品)。引文包括视频内容中的口语对话片段,如视频内容中角色或非虚构人物所说的台词和口头禅(例如,“愿原力与你同在”)。奖项包括任何与视频内容及其实体相关的奖项(如最佳男演员、最佳导演、最佳歌曲等)。应该认识到,这些例子不是详尽无遗的,其他类别的实体也是可能的。除了实体数据库,该专利还告诉我们另一种类型的数据库,称为“图”数据库。您可能会看到对这种类型数据库的更多引用,因为我已经开始看到它在来自谷歌的其他更新专利中被提及。它看起来像是一个很好的资源,可以用来回答人们可能有的问题:

在某些实现中,实体数据库还包括一个表示实体之间关联的图网络。例如,一个电影实体(例如,电影标题实体作为代表电影的实体)链接到它的演员成员实体、工作人员实体、故事中的位置实体、引用实体等等。图网络使用任何合适的数据结构来实现。该专利还告诉我们,它试图衡量视频中出现的实体有多受欢迎,以及这些实体何时在视频中出现,比如在新闻中。除了存储媒体源中出现的实体信息外,该专利还告诉我们,它包含总结媒体内容的信息,并存储来自媒体源的引用信息。在结束语

中,我已经在这篇文章中写了关于专利的内容。当一个公司调查了他们可能使用的过程或方法,并希望保护它不受其他公司的影响时,就会申请专利。仅仅因为谷歌可能拥有某个特定流程的专利,并不一定意味着他们正在使用它。但它确实表明,他们研究了一个特定的概念,并想出了如何使其发挥作用,并为此花费了时间和精力。我曾见过一些概念出现在多个专利中,比如我在本文中所写的许多专利都关注于使用媒体消费历史。谷歌可能在你日常生活中收听电视和收音机播放的超高频信息,这些信息被称为音频水印或音频信标,它们可以告诉谷歌你已经听到了商业广告、歌曲或演讲。它可以访问您订阅的媒体服务。你现在可以告诉谷歌你的兴趣,这样它就可以向你展示有关这些话题的新闻。

我过去写过关于谷歌位置历史,它跟踪所有你访问的地方,并可能显示你谷歌地图在一定距离内的搜索结果从你经常去的地方开始。它可能正在收集关于你所观看和收听的电影、音乐和电视的信息,以便回答有关你所消费的媒体的问题。作者:Bill Slawski

Bill Slawski是Go Fish Digital的SEO研究总监,也是SEO By the Sea的创始人和编辑。他住在距离太平洋几英里的加利福尼亚州卡尔斯巴德(北县,圣地亚哥),正忙着探索加州的历史,并在沿途拍照。他在1996年开始推广网站,并在90年代中期第一次看到Alta Vista后开始学习搜索引擎。从搜索引擎中阅读专利是了解搜索工程师对Web、搜索和搜索者的假设的一种很好的方式,在过去的12年里,他一直定期阅读这些专利并撰写相关文章。