北京时间2012年9月13日,以“开放 诚信 融合——迎接移动互联网新时代”为主题的2012中国互联网大会进行到第三天。科大讯飞副总裁 江涛 应邀参加了今天的“第二届中国移动互联网基地招商大会”,并进行了主题为“开启交互新时代”的精彩演讲。
以下为江涛演讲实录:
说到人机交互就是不断的让人变得更懒。十年前我们用手机的时候主要靠键盘输入,五年前iPhone带着多点触控可以用触摸操控手机。现在随着语音技术的发展,新的机会又出现了,就是智能语音技术。我在这儿说的智能语音技术就是让咱们的各种机器像人一样能说会听的技术。
讯飞的前身是科大的人机实验室,98年科大讯飞开始创业的时候我们也是抱定一个信念,语音是人类获取信息最自然便捷的手段。未来每一个手机、每一台电视每一个汽车都会像人一样能听会说,这样的信念支持下十几年来我们就做语音支持。现在确实条件已经逐步成熟。一方面关键技术的持续进步,现在陆续都已经达到了使用门槛。现在语音识别复杂的环境下已经能够达到90%以上,语音合成自然度已经达到90%,这些依赖于云、管、端这些外部条件的逐步成熟。国际商智能语音交换方兴未艾,昨天发布的iPhone仍然把SiRi作为最大的卖点。Google作为Android平台的拥有者,它对于未来智能终端的人机交互也是非常重视的。2009年Google为VoiceSearch为作为面向移动互联网的战略性产品推出,今年6月份也推出了新一代的语音搜索。
另外就是微软,比尔.盖茨06年的一次展会中提出过未来将在操作系统中实现自然语音的人机交互,他们收购了TeLLMEe,平台每年执行110亿次以上语音识别的请求。在中国我们东方人相对来说羞涩一点,不善于跟机器交互,但是我们还是在2010年启动了移动互联网的项目。2010年10月份我们在业界第一个发布了能同时提供高质量语音识别能力的讯飞语音云平台。一年多过去了,成果还是比较显著的,现在基于讯飞语音云的帐户已经有6000多个,上线的有几百个应用,覆盖了娱乐、虚拟形象搜索等等各个领域都有一些很典型的应用。
语音云的用户规模快速成长,2011年底上线,当时6个月做到了一百万的用户,剩下下半年从一百万增长到了一千万的用户。今年上半年讯飞语音云用户从一千万增长到了六千万。讯飞的语音云在汽车、电视上已经有很多应用。去年广州车展最火的一款车荣威350,内置了IVOKA五的系统,就是讯飞语音云。长虹新款的电视中都把讯飞的语音交互技术作为一个最大的卖点。