据国外媒体报道,Twitter即将可以让用户搜寻过去8年其平台上发送的5000亿条推文中的任何一条。相比之前的检索功能,这可以说是一大升级。
以往,用户只能够搜索近一周的推文,或者只能搜索被广泛转推或者大量收藏的推文。
该公司周二表示,其索引所有推文的项目为时数年,将会提升搜索和发现功能。这是Twitter近年专注的领域之一,它在尝试通过这样的举措使得其网站上内容变得跟用户更加相关。
Twitter工程师Yi Zhuang在公司官方博客上写道,“该新基础设施可带来很多的使用案例,给各类内容话题提供更加全面的搜索结果,如特定季的电视剧、体育赛季、大会(#TEDGlobal)、行业讨论(#MobilePayments)、地点、商户、各类长久的话题讨论(日本地震、2012年美国总统选举等等)。”
他补充道,新搜索功能将于未来几天向用户开放。
整个索引量相当于“大约5000亿份文档”,推文数量每周新增数十亿条,约为前一次的“实施索引”的100倍。上一次索引升级是在2012年,一开始仅允许用户搜索过去一周的推文。2013年的升级进行了一定的扩展,支持根据转推量、收藏量等因素来推送一周以前的推文。
Yi Zhuang还在博文中具体介绍了新索引功能背后的工程原理,讲解了如何扩展索引支持如此巨大的数据量。
据博文称,来自全面索引的结果将出现于搜索结果的“全部”标签,它最终将出现在搜索结果的“置顶”标签和新产品功能当中。