腾讯科技讯 1月18日,长期以来,谷歌的旗舰产品已经成为我们生活中习以为常的部分。但是谷歌没有懈怠,其搜索服务正悄然转型。
谷歌搜索17年来一直都在变
“天空为什么是蓝的?”孩子们经常问会这个问题,但是很少有父母能够立刻给出答案。以前,人们可能在百科全书或去图书馆寻找答案。近年来,父母则可以冲向电脑,在谷歌搜索中输入这个问题,然后打开各种链接,阅读各种解释,最终给孩子答案。
但是到2015年,即使看似很迅速的电脑查询也很少有人去做了。因为与移动设备相比,在电脑上输入搜索问题答案更为复杂。你不仅要在众多链接中选择最相关 的链接,有时候甚至无法立刻得到明确无误的答案,人们对此感到失望,甚至愤怒。而Android手机上的语音查询功能,只需不到1秒钟就给出了可以理解的 答案。
谷歌搜索引擎团队负责人阿米特·辛格尔(Amit Singhal)利用这个例证帮助证明:在过去几年,谷歌这个迄今为止世界上最受欢迎的搜索引擎正悄然改变着自己。在接受采访中,辛格尔细数了谷歌搜索过 去多年做出的改变,包括其改变了排名算法、添加了新的信息库(比如图片、书籍以及旅行等)、在用户输入问题前就开始搜索答案等。
过去几年中,谷歌不仅改变了其搜索引擎,其“驾驶舱”也有了很大变化。随着手机不可阻挡的崛起,2015年,人们在手机或平板电脑上进行搜索活动将首次超 过在台式机上的搜索,这将迫使整个搜索行业发生天翻地覆的巨变。辛格尔说:“在世界正向着移动方向发展时,我们不得不深刻思索搜索引擎代表的意义。而每当 想到这个问题时,我们的头都要爆炸了。”
在过去17年历史中,谷歌搜索一直处于进化之中,谷歌经常以博客条目和偶然的新闻事件庆祝这个过程。因为搜索引擎至今依然是谷歌的旗舰产品,这个支持广告 的平台也依然是谷歌收入的主要来源。对这个每天超过10亿人使用它查找信息的服务,谷歌从未停止过改进它。但在去几年中,这种改进步伐正在加速。无论长期 还是短期努力,都要确保谷歌领先于竞争对手。
用户不会忘记谷歌搜索发生的一些变化。搜索速度越来越快,结果越来越新鲜,越来越社会化。谷歌搜索甚至看起来已经不同。负责谷歌搜索体验的高管塔马尔·约 书亚(Tamar Yehoshua)说:“早期,我们只有较少功能,包括主页和搜索结果。可是今天,我们的搜索结果页面可以显示许多不同的功能和产品。”
互联网正成为谷歌最大对手
展望未来,谷歌一直是推动人工智能发展的先锋,希望建立巨大“人脑”以便更好地理解用户和世界,提供人类思及却还未问出口的问题的精确答案。然而许多批评 家认为谷歌搜索正走下坡路。他们抱怨搜索结果中有太多垃圾信息,或过多强调先前结果的新信息。当你输入一个主题时,经常会出现令人感到混乱的结果,为此甚 至有许多人高呼“谷歌搜索变得更无用!”
辛格尔猛烈驳斥这些指控,他说:“事实恰好相反,我们曾仔细研究那些抱怨,我发现许多人都是怀旧主义者。实际上,我们的搜索已经变得更好。”辛格尔的评论 充满着自豪与自信,这也是今天谷歌搜索团队关键成员的共同态度。几年前,尽管谷歌坚信其搜索质量无与伦比,但实际上该公司非常担心市场主导地位弱化。谷歌 也曾经历Facebook的阵痛,甚至被比作失败的泛美航空公司。
但是现在,几乎没有人再进行这种类比。Facebook的Graph Search依然是一款新型产品,对谷歌地位影响不大。从搜索质量上看,微软的必应堪称受人尊敬的对手,但其进展搜索市场份额1/5。尽管Google Plus未能实现公司试图最终创造一鸣惊人的社交网络产品的目标,但它的确取得成功,并正吸引更多用户。
相反,一直与谷歌关系紧密的互联网正成为前者最大竞争对手,其对谷歌搜索的威胁是将用户从网站吸引到五彩斑驳的应用上。谷歌认为应用中信息增加的趋势可以 克服,毕竟像webmasters这样的移动开发商需要他们的信息被发现。自从2013年秋季以来,谷歌已经设立App Indexing,试图绕过移动应用中的数据进入其总的索引中。可是,现在50%来自Android签约用户的搜索结果显示应用内的信息。App Indexing不包括iOS应用,这是个严重缺陷。Apps Indexing产品经理劳伦斯·张(Lawrence Chang)说:“虽然依然还有很长的路要走,但我们正建立起基础模块。”
现在,应用扩散还未影响到谷歌在搜索市场的主导地位。统计数据显示,谷歌每天接受的搜索请求高达30亿次。在美国,2/3的搜索使用谷歌。从全球来看,谷 歌也占据这类似主导优势。更令人印象深刻的是,谷歌也占据着移动搜索超过80%的份额。当2013年谷歌遭遇“5分钟停电”事件时,全球网络流量下降了 40%。
没有搜索领域的竞争对手可威胁到谷歌的基础设施,它拥有雄厚的人才实力以及丰富的经验。此外,也很少有竞争对手具备谷歌那样的雄心。因此当谷歌被曝应对监管问题、谷歌眼镜停售后,谷歌旗下视频分享网站YouTube以及搜索服务都经历了稳定和激烈的革新。
最大挑战是从桌面向移动转移
从某种程度上说,这种革新只是简单延续了谷歌自成立以来一直不断进化的搜索方式。在微观层面上,谷歌对其算法进行了细微调整。实际上,在每周搜索质量启动 会议上,都会有类似细微调整。然后每隔2到3年,谷歌会对其搜索排名系统进行大幅调整,根据与企业高度相关的关键词评出赢家和输家。辛格尔的高级助手本· 格莫斯(Ben Gomes)称,在过去3年中,谷歌对排名系统进行的调整比此前13年总和更多。
从各个方面来看,谷歌搜索面临最大的挑战是搜索正从桌面向移动设备转移。与许多互联网公司一样,谷歌搜索采取“移动中心”策略,探索如何与用户互动。谷歌 搜索引擎主设计师乔恩·韦利(Jon Wiley)说:“移动已经对我们的设计方式产生巨大影响。”韦利担任搜索引擎主设计师后,他做的第一件事就是将移动与桌面团队融合。最初,这种方法只在 设计手机时使用,现在搜索引擎也需要多设备体验。
寻找问题的单一正确答案
当涉及到重大改变时,无疑谷歌搜索团队成为重中之重。辛格尔说:“首先,知识图谱(Knowledge Graph)尤为重要,只要你建立起它,你基本上就可以了解真实世界的一切。第二件重要的东西是语音,因为我不能在这里输入(手腕上的三星智能手表)。随 后,我们意识到预言背后需要科学支持,以便于人们不必一直问下去。最终我们建立了Google Now。”
知识图谱将有关世界的信息汇聚到庞大数据库中。语音搜索包括口头语言搜索。Google Now可以在人们提问前就告诉他们想要知道的答案。这三者正帮助谷歌专注于移动搜索。尽管它们肯定不是谷歌搜索的全部,但这些元素在过去3年中帮助谷歌搜 索实现转变,它不再像电脑那样笨拙,而是拥有丰富的智力,可以为你提供明确的解释,满足你的信息需求。而且这一切都不需要你看着进行。
当谷歌于2010年宣布买下名为MetaWeb的公司时,并未引发太多关注。但这起收购却成了谷歌搜索发生重大转变的关键。MetaWeb是著名电脑专 家、企业家丹尼·希利斯(Danny Hillis)2005年成立的,他炮制出一系列创新项目,但他认为这些项目过于庞大,只靠他的MetaWeb无法实现。希利斯说:“我们正努力创建世界 数据库,囊括全世界的信息。”
由于MetaWeb通过扫描互联网回答问题,因此其被普遍视为谷歌的竞争对手。但数年之后,这家公司获得5000万美元融资,希利斯意识到只有成为更大公 司的一部分,他的愿望才能实现。当时,谷歌已经开始为接受的问题提供一些直接答案。比如你输入奥巴马的生日,它会将1961年8月14日的搜索结果置顶。 但2010年7月宣布收购Metaweb时,谷歌解释称,其搜索引擎无法回答这样的问题“3万美元以下学费的西海岸大学”或“至少赢过1次奥斯卡奖的40 岁以下演员”。谷歌承诺,Metaweb将帮助谷歌回答这类问题。
Metaweb产品经理艾米丽·默克斯里(Emily Moxley)说:“当谷歌收购Metaweb时,它知道事物的概念,这将成为搜索中非常重要的部分。我们认为这是迅速总结人们关心的事物的事实和信息的 伟大方式。”2012年,谷歌推出Metaweb服务,称之为知识图谱。这种产品可为原始搜索结果提供补充答案,包括所搜索物体的关键事实等。
在过去2年多,谷歌搜索逐渐与知识图谱融合,谷歌正继续开发这种产品。最初,知识图谱只是静止的,但它渐渐通过谷歌搜索进化出学习能力,可分析用户行为。 知识图谱也正在踏入另一个关键领域——新鲜。由于谷歌专注于提供一个问题的单一正确答案,其信息必须是最新更新的。否则其可能提供错误信息,那对用户来说 还不如不查询。
谷歌有改进其搜索引擎的庞大计划,不断添加其新的元素。近来,谷歌添加了汽车、视频游戏以及雨果奖得主的知识。但默克斯里说,谷歌也在尝试如何给出更复杂 的结果。这些结果不再仅限于迅速提供事实,也不能给出更主观而模糊的联系。她说:“人们不再仅对事实感兴趣,他们也对主观的东西发生兴趣,这些都有助于知 识图谱的计划。”谷歌不想让你觉得正在机器上进行查询,而是在请教一位无所不知的博学者。
但是谷歌要实现这个目标还需要更多努力,而且从知识图谱获取更多帮助的期望也不乏挫折。就连默克斯里近来都气愤不已,她发现知识图谱了解很多电视剧,但却 缺少有关新剧情及其播放时间的信息。此外,知识图谱的最大失误就是它至今依然未能帮助谷歌回答其2010年收购Metaweb时提出的两个问题,即“3万 美元以下学费的西海岸大学”或“至少赢过1次奥斯卡奖的40岁以下演员”。但默克斯里坚信,谷歌最终可以跨越这个“过渡阶段”,最终实现目标。
打造会话式搜索引擎
一旦意识到移动技术变得无处不在,谷歌决定对其搜索引擎进行微妙而深刻的改变。谷歌不再将查询视为向电脑系统提交的指令,而是将所有输入视为“某种会话”。辛格尔的高级助手格莫斯说:“显然,当你拥有手机时,语言变得更为重要。而当人们讲话时,显然比打字更自然。”
这种逆转不仅意味着搜索引擎处理查询的方式需要改变,同时意味着我们自己也要改变。负责谷歌搜索体验的高管约书亚(Tamar Yehoshua)说:“在谷歌之前,人们在查询中很少去思考。我们已经教导人们多年,让他们在查询时思考。但这并不容易,人们通常在正常会话时,也不会 如此。”
要想做出这种改变,需要两个前提。一是谷歌搜索引擎需要更仔细地倾听,并拥有解析半乱码视频输入的技能;二是谷歌必须能够确保,当有人对话筒讲话或通过口语在搜索领域交流时,其系统能够知道这些人在谈论什么。
可以肯定,谷歌已经涉足语音识别领域很久。约书亚说:“许多年前,我们已经预见到语音、自然语言处理技术非常重要。我们知道需要投资解决这些技术问题,而且需要多年才能取得回报。”
早在2000年左右,谷歌就开发出名为Google 411的服务,它与电信公司客户拨打付费电话查询系统类似。谷歌利用数百万免费电话了解如何通过同一种扬声器纠正不同的语言和语音。这种尝试很有用,谷歌 搜索现在有159种语言,语音搜索可识别58种语言。谷歌宣称,其应用中文字错误率下降至8%。格莫斯自豪地指出,这是谷歌进步的一大里程碑,他甚至亲自 做了语音查询演示。
但是谷歌也不得不进行反思:谷歌搜索应该像Siri那样被赋予准人格吗?亦或是利用可识别的机器人语音维持用户的人类意识,以便于让他们了解自己正与机器系统对话,对方不是复制人。谷歌选择了后者。
但是科学发展的速度非常快,可以为谷歌提供高水平的语音交互支持。格莫斯说:“我想需要3到4个前提能收实现语音互动,那需要电脑速度更快,处理器、硬件以及麦克风等都更好。此外,软件算法也需要明显进步。但是最大的改变是我们理解语言的能力。”
著名科学家费尔南多·佩雷拉(Fernando Pereira)过去30年间一直致力于自然语言处理(NLP)研究。他称,在搜索查询与网络文件和其他信息库匹配方面,谷歌已经做得非常棒。佩雷拉称: “当你开始搜索时,有很大机会你使用查询的词汇将出现在结果中。但将知识图谱这样的数据库加入搜索引擎中,将带来新的挑战与机遇。很难预测你使用的语言是 否与数据库中设计的语言方式相匹配。”
另一方面,这也很难实现。当在谷歌搜索中查询“巨人队在哪儿玩球?”这样的问题时,它必须知道很多背景知识:查询属于体育范畴,这个球队正在主场馆中打球 等。它还必须做出选择:是巨人棒球队还是橄榄球棒球队?用户想知道这支球队通常在哪里训练亦或是下周在哪里比赛?谷歌利用信号和用户以前的行为确定答案。 佩雷拉说:“现在我们做出的所有计算、推理都是几年前无法想象的。”
一旦这些障碍被克服后,谷歌的NLP系统会在知识图谱的帮助下进一步提高。格莫斯说:“我们开始理解世界上的事物。”这让谷歌可以在用户未输入完问题前就给出正确猜测。而且随着谷歌理解的东西越多,他对你的理解就越充分。
用户查询之前就能获得答案
2004年时,我曾询问谷歌创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)有关他们对搜索引擎的长远看法。佩奇表示,搜索引擎将融入人类大脑。他解释说:“当你思考某事时,你对它可能不会了解太多,你将可以自动获得信 息。”布林指出,关键是你需要可对话的设备,或能够关注你周围环境的电脑,这些都暗示着有用信息。
2010年,Android团队的工程师巴利斯·古尔特金(Baris Gultekin)与安德鲁·基尔斯姆(Andrew Kirsme)创建了Google Now。它与谷歌搜索功能相结合,用户搜索的关键词被记录下来,Google Now智能化读取关键词后,为用户提供相关的语音服务。除了处理速度快之外,Google Now针对用户需求“主动”为用户发出提醒,而不仅仅是回答用户的提问,产品性能更为人性化。古尔特金称:“我的目标是Google Now应该能向你提供最需要的服务,其他设备都只能成为备用品。”
Google Now的有效性取决于其对这个世界的了解有多深,而这需要依赖谷歌搜索提供,包括大量个人信息的知识图谱。这也就是为何有人认为Google Now真的可被视为谷歌搜索的替代品。每次及时提供信息卡,Google Now都吸收了大量谷歌服务。通常情况下,人们不知道Google Now到底能做什么,直到使用它时。比如,当你停车时,Google Now会记录你停车细节,包括具体地点,以免你忘记车停在哪里。如果你的电邮告诉Google Now你正在寻找住宅,它会推送你希望居住地域的住房照片。
随着Google Now的进化,它现在已经成为全时服务。Google Now最大的进步发生在2011年,当时苹果推出了语音助手Siri,在Googleplex引发恐慌,谷歌投入更多资源开发这个语音项目。古尔特金说: “谷歌搜索与Google Now都值得赞美。我们希望能在你进行搜索之前就为你提供所需信息,但是在很多情况下,我们不知道你的水管破裂,为此你需要水管工。”
约书亚说:“佩奇曾说过,搜索应该能够理解你的意图,并向你提供需要的信息。在谷歌的生态系统中,如果你在手机或桌面上签名,我们就可以利用。如果你想知 道航班信息、追踪你的行李或任何我们得自Gmail的信息,你就能得到。如果你不使用Gmail,你无法得到信息。但你依然可通过语音功能询问,并可获得 答案。”
谷歌没有将Google Now作为独立产品推出,反而将其作为搜索应用的一部分。这种应用本身未被标记为搜索应用,它只是谷歌的附属产品,但其对谷歌同样重要。Google Now的组件是可选的,它似乎无所不知,这让我们感到很不安,并提醒谷歌是多么了解我们!谷歌掌握我们的私人信息已经引发麻烦,特别是在欧洲,当地政府推 动对其加强监管,甚至要分拆它。即使信任谷歌的人,在斯诺登泄密曝光政府如何轻易获得我们的信息后,这种信任也在降低。如果Google Now知道你将车停在哪里,情报机构是不是也知道你的位置信息?
辛格尔认为,搜索的第一个时代以人们实现可视化互动为标志,发生在他们与一臂之隔的机器之间。而现在,我们正缓慢滑入一个新的搜索时代,我们的移动设备正 成为半机械人的附属物。我们期望手机能够了解我们的意图,我们期望搜索能够提供包括我们个人信息在内的精确答案。辛格尔说:“我将搜索视为所有计算的界 面。当设备消失或变小后,你如何与它们互动?因为大多数时间里,你需要行动起来,或许你只是播放音乐或写个留言,或询问妻子的航班时间以及奥巴马有多高 等。”
人们可能已经对它习以为常,抱怨谷歌搜索不同以往。辛格尔承认,谷歌搜索有许多问题需要解决,但是他依然充满了自豪地描述查询背后的科学,它不再是失败的。当有人试图问“天空为何是蓝色”这样的简单问题时,谷歌能够给出成功的回应。
来源:互联网