在过去六个月里,各大科技公司均通过发布新技术、新产品,展望了计算机的未来。有趣的是,所有公司的看法几乎一致:未来,你可以和你的电脑聊天。
微软将其称之为“对话平台”、谷歌则希望其应用都具有“持续的双向对话”能力,而苹果的Siri、亚马逊的Alexa,实际上都能够在不同程度上与人类沟通。Facebook CEO扎克伯格则进行了进一步总结:“我们的人工智能目标是建立一个比人类感知更好的系统,包括视觉、听觉、语音等等”。
显然,语音是关键。十几年前的科幻电影中,我们已经看到了各种各样能够与人类自然对话的电脑,这种趋势在当时就已经形成。随着人工智能、云计算的发展,这些语音助手们将在基础行业发挥更大作用,比如Domino比萨,已经启用了订购助手多年。不过,这也说明了一个问题:各种语音助手和工具都各自为政,为自有平台服务,使得整个计算机语音市场极度混乱。
从说“嘿”到新的沟通级别
目前,世界上主流的语音主流包括Siri、Alexa、Cortana、Facebook M、谷歌助手等等,但真正具有影响力、开放的第三方产品屈指可数。这种情况造成了硬件为王的发展趋势,你需要选择特定的硬件,来使用这些服务。另外,它们的定位也不尽相同,苹果和谷歌更专注手机等移动产品及汽车,亚马逊则放眼智能家居,微软和Facebook的据点不太确定,但同样,涉及很多领域。
今年,科技公司对于自然语音处理技术的关注更加深入,从3月开始,微软推出了一套AI开发工具,开发者们可以使用它创建自己的人工智能应用;4月,Facebook开放其Messenger应用作为一个机器人平台,“你永远不用再拨打800客服电话了”,扎克伯格这样说;而微软CEO纳德拉则将聊天机器人描述为“新型应用程序”。
纳德拉认为,未来类似Cortana或是Alexa将成为机器人们的老板,与用户更深入的互动、沟通。然而,The Verge认为这可能是一个过于简化的总结,真正的情况会更混乱。语音助手与机器人的沟通会像与API沟通那样顺畅?这些不同的应用程序如何安全地交换用户数据?何种软件会听懂你的俚语并将其写入邮件?你怎样让它们停下来?还有太多问题尚待解决。下面,一起来看看各种语音助手的发展情况及趋势。
亚马逊
Echo和Alexa的受宠,可能是亚马逊一开始没有预料到的。其服务基于家庭,Echo作为一个集成Alexa助手的硬件终端,始终在聆听用户的命令。在开放API之后,Alexa目前已经支持1000多家服务,其开发工具也非常简单,亚马逊表示开发者可以在一个小时便完成软件集成。
Echo之所以越来越强势,是因为它掌握了一些基本规则,比如在房间中使用、Alexa的快速响应能力和扩展性等等。另外,亚马逊也开始允许其他硬件厂商植入Alexa。不过,Alexa并非没有弱点,本质上它不像SIri等语音助手般聪明,它更注重命令、而非自然语音处理。不过,有迹象表明亚马逊将继续改善完善Alexa,包括添加情感处理能力,这将有助于Alexa变得更加人性化、形象化。
苹果
尽管苹果是最早推出语音助手的公司,但实际上已经落后于竞争对手。Siri的语音识别能力不稳定、功能限制,导致极少用户使用。而在今年WWDC开发者大会上,苹果对Siri进行了一些加强,包括集成第三方服务、兼容Mac等,这使其看上去更好用。
另外,iOS平台的强势,有机会让Siri无处不在,包括你的手机、电脑、汽车,这是微软和亚马逊不具备的优势。当然,Siri需要更聪明,不仅仅是能讲几个笑话、能直接回答问题、能够调用第三方应用程序。而在目前阶段,提升AI的一个有效方法是收集用户数据,但苹果表示将尽可能不使用这种方法来实现机器学习,具体效果如何,还有待时间来验证。
Facebook在语音助手的竞争中可能是最弱势的,主要是它在聊天应用中集成的数字助理,更像是传统的老式组合规则,而非AI。另外,用户只能通过输入文字提出问题,API会在数据库中搜索相近答案,可能会耗时数分钟才回答。当然,Facebook也有其长项,其机器学习团队创建了一些图像识别功能,具有显著成效。
当然,Facebook需要加快脚步跟上竞争对手的脚步,提供更迅速、智能化的助手应用,没有人希望等上一个小时才知道今天天气怎样。
谷歌
在所有科技公司中,谷歌的资源实际上最具优势,因为它本身是全球最大的搜索引擎,并且不避讳收集用户数据,对于机器学习、语音助手发展来说是宝贵的资源。今年5月,谷歌在I/O大会上非常强势地表达了发展AI的愿景,包括推出谷歌助手服务、谷歌Home音箱等等,服务涉及到智能手机、应用甚至是智能服装,令人印象深刻。
另外,谷歌对于机器学习、AI的研发也比其他竞争对手更积极,包括AlphaGo、开源的机器人学习软件Tensor Flow等等,这意味着它极有可能在消费级的语音助理领域获得更多份额。同时,谷歌在本月发布针对企业的Springboard搜索服务,其中包括对用户提出可行性建议和信息的功能。虽然这是一种相对低层次的AI功能,但谷歌产品所拥有的广泛覆盖面,会为其全面发展AI带来优势。
微软
微软Cortana最大的不同是它几乎没有移动平台(Windows Phone已回天乏术),所以Windows 10成为其根据地。而由于Windows 10的全平台化,Cortana会出现在台式机、笔记本甚至是Xbox上,从某种角度来说也成为电视语音助手。
虽然你可能并不会在PC上使用Cortana,但微软已经将聊天机器人、语音助理放到相当重要的位置,在今年3月的Build大会上,它推出了Bot Framework、一套AI开发工具,帮助开发者创建自己的聊天机器人。听上去,微软似乎是“淘金热”中的一员,但无论其动机是什么,都会促进该行业的发展。
其他
市场中不乏一些小公司带来的语音助手软件,诸如Hound、Amy、Viv等,其中Viv还是来自前Siri开发者,他认为苹果的平台不足以带动Siri发展,所以创造了Viv。另外,还有诸如帮助用户订购午餐的Howdy等简单的机器人,以及类似Chatfue、Msg.ai等机器人平台和工具包。
对于这些小规模的公司来说,其产品的最大劣势在于没有关注度和平台优先度。即便它们的形式可能是更广泛的Web、或是兼容多系统的应用,但没有人使用,便无法获得用户、生成数据和进步。试想一下,即便Viv很聪明,但人们使用的是苹果iPhone,Siri无疑是具有平台优先级的,这是Viv无法比拟的优势。
接下来呢?
The Verge认为,从目前的发展趋势来看,混乱将是语音助手们带给用户的最直接感受。你可能需要同时面对PC上的Cortana、手机上的Siri或是谷歌助手,回到家中使用Alexa,开车时再用回Siri,这种分裂式的使用体验与平台之争有着必然联系,也是无法避免的。毕竟,它们都是商品,都是厂商用户赚钱的工具。
当然,数字世界是不断发展的,想想过去十年技术的进步。随着智能助理、语音助手们在更多领域流行起来,它们最终可能会找到一种共存的方式,更像是同伴,而不是竞争对手。未来有一天,你可能会感到与电脑聊天更加舒服惬意。
[…] 在很多国外科幻大片所描述的未来生活中,使用语音方式来操控家电的炫酷场景无处不在。比如在《美国队长 2》中,神盾局的头子用语音操控虚拟桌面、窗帘和电视;在《钢铁侠》系列电影中,男主角回到家以后,说声想喝咖啡,咖啡机便开始冲咖啡;在《碟中谍 4》中,阿汤哥通过用语音来开灯和开电视。 […]