Nuance Dragon
中文版Dragon和其它多数语音识别软件一样,不能达到百分之百的识别率。因为首先对于语音识别来说,中文一直是一个极具挑战性的语种,普通话虽然只有400个单音节声音,但他们却仅仅能通过声调予以区分。
比如,妈妈的“妈”这个字读一声“妈”,四声是“骂”,三声是“马”,所有这些字读起来都跟“ma”大同小异,所以说开发出一款能够识别不同声调句子的软件的确不易。
除此之外,尽管普通话是中国的国语,但是中国拥有很多种方言和数不尽的地方口音。Dragon研发副总裁吉姆·吴(Jim Wu)就表示:“在中国大陆,每个人都有不同的口音,我们面临的其中一项挑战就是确保系统能够识别口音较轻的普通话用户。”
Nuance总部位于美国马萨诸塞州伯灵顿市(Burlington),2011财年的营收为14亿美元。2011年3月,Nuance在推出Dragon英文版应用之后相继推出了两款免费中国普通话版Dragon应用。2011年6月,Nuance还推出了广东话和台湾话版应用。 Dragon口述(Dragon Dictation)应用可以用于转录文本、电子邮件、Facebook及Twitter信息。Dragon搜索(Dragon Search)则可用于互联网搜索。但同Siri的不同之处在于,Dragon无法对用户的问题给出反馈。
在实际使用Dragon时,用户只需要点击虚拟按钮便可以开始和停止录音。所有过程都在服务器端进行。Nuance首席营销官皮特·马宏(Peter Mahoney)表示,Dragon口述过程将上传至服务器,由服务器进行分析、录制,然后将文本发回至设备上。
尽管目前Dragon还不是完全准确,但马宏表示Dragon应用可以自主学习并提高准确率。由于所有语音处理都发生在服务器端,因此Dragon收集用户语音数据来学习语言,找到合适的词汇进行组合。而且,Dragon还可以适应每一位用户的地方口音,适应的越好准确率越高。马宏还表示:
“将这些录音将保存下来,我们就可以使用自动化工具来分析结果。有时,人们需要使用录音来看看自己怎样才能做的更好”马宏最后说道。
来源:互联网 转载于临企葡萄牙语网站建设新闻频道