这项技术突破是百度CEO李彦宏的前瞻性视野和技术布局结出的硕果之一。2013年初,百度成立深度学习研究院,李彦宏亲自担任院长,将语音和图像 作为重点突破方向,面向全球广揽贤才。今年5月,百度研究院组建,下辖北京深度学习实验室、大数据实验室和硅谷人工智能实验室。李彦宏将全球最为知名的人 工智能专家吴恩达招致麾下,出任百度首席科学家。如今,群星璀璨的百度研究院云集了一大批世界顶级人工智能专家,在语音和图像等领域取得了突出进展,引领 着全球人工智能的技术创新。这些技术成果正在被快速应用于百度生态的产品与服务当中,让用户广为受益。
《福布斯》报道说,百度研发的 “Deep Speech”是一款采用深度学习技术的语音识别系统,它可以在饭店等嘈杂环境下实现将近 81% 的辨识准确率。相比之下,其他商业版语音识别 API,包括Bing、Google 以及 Wit.AI 等的最高识别率却只有65%。与顶级的学术型语音识别模型相比,Deep Speech也高出了9个百分点。吴恩达透露,“Deep Speech”的成功很大程度上要取决于百度规模庞大的深度学习基础设施,这比他在斯坦福和谷歌使用的系统运行速度快了近40倍。
过去的半 个世纪里,伴随创新加速,用户的技术使用门槛在不断降低,移动时代表达需求的方式更是发生着巨大变化。在今年百度世界大会上,李彦宏提出他对于未来科技发 展的行业洞察——科技正在回归人性。语音的历史已有二十万年,是人类自然的、低门槛的表达方式之一。他认为:“未来5年,消费者使用语音和图像表达需求的 比例将超过50%”。
首届百度技术节进一步明确了百度语音技术的应用方向——推动手机和物联网两场革命。当前,物联网将传感器、控制器、人 和物等通过互联网技术连接在一起,语音技术的成熟将进一步提升物联网的智能化连接。未来人们日常使用的家电设备,如电视机、微波炉、音乐播放器等,都可以 通过语音指令操控,提升用户在移动时代的智能生活体验。