奇笛网 | 关注智能家居落地 奇笛网 | 关注智能家居落地

专访|汤兵城:三大业务爆发,思必驰AIOS引领人性化智能语音交互

发布于 2017/03/15-15:20 标签: / / /


汤兵城,思必驰商务拓展总监,是《电器》记者在过去三年中,采访这家公司的第四人。可以说,从思必驰坚持To B并转型至专注智能硬件领域以来,在资本市场每一次获得青睐,与阿里智能、庆科、绿联等生态伙伴的每一场合作,笔者几乎没有缺席。这期间,思必驰经历了移动互联的风口、语音交互技术的升级以及团队人员的完善,从2014年至今,面向智能车载、智能家居和智能机器人三大垂直领域,为其提供自然语言交互解决方案的思必驰,被业内成为可与科大讯飞二分天下的语音巨头。

2017年3月10日,在中国家电及消费电子博览会期间,思必驰商务拓展总监汤兵城做客《电器》杂志专访间,从2016年云栖大会YunOS@Home专场谈起,详解伴随三大板块提升,思必驰是如何引领人性化智能语音交互技术。

独家AIOS,奠定优势基础

谈起公司在三大垂直领域的发展,可以用强劲二字来形容。据汤兵城介绍,在车载后装市场,思必驰与阿里旗下的高德地图合作已久,Yun OS全线产品所搭载的语音系统都是思必驰提供。在Android系统方面,与IME、瑞联、天之眼等都保持密切合作。在车载后装市场奠定基础的同时,思必驰加速前装市场,如今与奇点汽车、小鹏汽车等互联网造车企业已经进入后期调整。在家居方面,与阿里、腾讯、小米、联想、海尔、美的等建立合作关系,推出的产品包括电视、音箱、OTT盒子等。在智能机器人方面,与大华乐橙、360等中高端品牌合作密切。擅长唱歌跳舞的小萝卜机器人、智能程度颇高的大华乐橙小乐机器人、360小巴迪机器人等都已经推向市场。

专注细分领域是成功的关键,但技术积累必不可少。能够在这三大领域保持自然语言交互解决方案商的领先地位,与思必驰在2015年推出的对话操作系统AISpeech Operating System(简称:AIOS)密不可分。据汤兵城介绍,源于英文缩写的AIOS相当于思必驰的独家系统,它可运行于主流操作系统(Linux, Android,QNX)之上,封装核心的语音相关技术和对话交互逻辑,同时对上层应用制定了一层领域抽象接口,支持快速集成和自定义开发。

他说,思必驰把语音相关技术整合成AIOS 人机对话操作系统,作为安卓系统之上的一层标准接口,提供给硬件合作伙伴,能够极大减少开发及维护成本。针对不同场景,AIOS又分成了AIOS for Car,AIOS for Home,AIOS for Robot等版本,而这些版本成为日后思必驰发力三大板块的基础。

创新模式,成就语音交互独角兽

虽然AIOS成为很多语音创业公司效仿的重点,但对系统的重视程度难以和思必驰相提并论。据汤兵城介绍,公司会根据不同的系统量身打造AIOS,强调语音识别、语音合成、语义理解、声纹识别、对话管理、音频分析等技术的定制化处理,并且对接了丰富的第三方内容资源,比如酷我音乐、虾米音乐、大众点评以及股票天气、故事读物、笑话大全等。这一整套下来,正是汤兵城眼中人工智能语音交互的重要组成部分。

作为人工智能重要的组成部分,汤兵城强调,思必驰从头至尾都会把更多的精力聚焦在语音交互的体验上。汤兵城进一步解释说,公司做语音识别起家,相比其他人工智能公司更加专注,思必驰的联合创始人俞凯是剑桥的语音博士,现在是上海交大教授,所以公司在自然语言处理技术等方面也更专业。此外,同科大讯飞一样,思必驰具有全套语音技术产权,并成功实现了“产学研”结合,雄厚的技术积累也是的思必驰在系统上迭代升级非常快。相比其他语音创业公司,思必驰更专注在智能硬件在具体场景的语音交互。据悉,思必驰和上海交通大学建立了智能人机交互联合实验室,并达了完善的独家知识产权协议。另外,B2B2C的商业模式与其他公司也有不同。

据了解,AIOS已经成为中国智能车载后装市场中占有率最大的语音解决方案,占有率达到60%左右。采用这款系统的车载产品包括了著名的捷渡“远界”智能后视镜、祖师汇云龙智能后视镜、天之眼智能后视镜、车萝卜HUD等,是当之无愧的独角兽。

环形“6+1”远场麦克风阵列      提高交互体验

提高用户体验,是汤兵城在采访中提到最多的几个字,他举例说,家居环境下的噪音有混响、回声、背景噪音、人声干扰等多种类型,此外远距离交互也是语音交互领域要解决的一个难点。在噪声干扰或者距离稍微远的环境下,即使是优质的语音软件方案也不能得到好的交互效果。针对这个问题,在AIOS软件方案之外,思必驰研发了一个软硬一体化的解决方案,那就是环形“6+1”远场麦克风阵列,属于数字信号处理范畴,6个麦克风呈环形均匀分部拾音,中间1个麦克风辅助拾音。阵列获取声音信息之后,利用拾音波束成形,采用独特算法,抑制波束之外的噪声,并融合语音信号信息,从含噪声的语音信号中提取出纯净语音,增强说话人语音。从而可以确定信号来波方向,达到抗噪目的的同时,还增强了人的声音。

据了解,用“环形6+1远场麦克风阵列”对声音信息进行处理之后,智能设备可以做到5米远场交互(准确率达到92%)、360°全角度环形拾音、声源定位精确度控制在±10°以内。“该阵列为国内首款同类产品,大大增强了降噪处理和远场识别,再结合丰富的后端第三方资源,提高了交互体验。”汤兵城表示,“目前,思必驰的“环形6+1远场麦克风阵列”主要针对的是智能机器人和智能音箱等设备,未来会在更多家电产品上应用。”

迭代升级,满足更多客户需求

用户通过各类硬件、家电的使用调用思必驰的云端,每天都会产生海量数据。凭借这些,首先可以进一步优化、训练声学模型,使得声音识别率无限逼近于百分之百。其次,通过数据分析,可以挖掘一些新的商业模式。当然这些需要过程,眼前对思必驰而言重要的做到专注与聚焦,以及提升用户的体验。

没有时间考虑行业竞争与抄袭,思必驰正忙于拓展新领域。在本次AWE上,思必驰展示了联想在CES发布的智能音箱,其海外版搭载亚马逊Alexa平台,国内版则采用了思必驰自然语言交互方案,能够实现流畅的语音交互,涵盖音乐播放、新闻、有声读物、查询天气、语音叫车、订外卖等服务,是用户的贴心助理。此外,小米互联网音箱、与庆科联手打造的VBS6100AI语音模组,搭载了思必驰ASR、TTS等语音技术的方案,具备语音交互功能,高度集成了多方技术优势。

此外,还有声必可语控背景音乐系统、乐橙TC5S人工智能摄像机、乐橙小乐育儿机器人、诸葛小明床头灯以及美的洗衣机,海尔馨厨冰箱等产品。

分享(

发表评论

奇笛网 | 关注智能家居落地

此文需注册才能阅读X

笛文共欣赏,疑义相与析

现在注册登录 或 使用社交帐户快速登入: QQ登录 新浪微博登录 腾讯微博登录

返回顶部 最酷视频
扫二维码
扫二维码

X

无须注册,直接使用社交帐号登录

忘记密码,找回

Loading 登录中...

没有帐号,注册

已有帐号,登录

Loading 注册中...

已有帐号,登录

发送中...