7.29思必驰【语声纪元】新技术发布会,在深圳3W咖啡顺利闭幕。从内场活动到外场体验,从技术发布到经验分享,整个活动现场座无虚席,共500余人到场参与了本次思必驰新技术发布会。
本次发布会由思必驰CEO高始兴主持,由思必驰联合创始人、首席科学家俞凯教授讲解技术。俞凯博士是剑桥大学语音博士,所负责的美国军方语音识别项目和端到端人机对话系统技术曾荣获多项国际大奖,现同时担任思必驰-上海交大智能人机交互联合实验室负责人。
(思必驰联合创始人、首席科学家 俞凯)
随着智能硬件时代的全面到来, “人机交互”的概念也被炒得火热。在移动互联时代,由于交互模态和交互目标的丰富,用户对人机交互的自由度和丰富性的需求日益提升,已经不满足于简单的搜索功能,而是正在逐渐向“任务处理”变迁。
但是目前语音技术面临着巨大的挑战。真正自由和稳定的人机交互系统不仅需要解决语音的“感知/表达”,即传统的语音识别和合成,更需要解决认知理解和抽象思维的智能。这需要经历两个阶段,一个是传统语音技术的优化,使其更加人性化;二是对话技术的使用,采用认知交互智能提升任务完成的水平和用户体验。
(俞凯向参会者介绍思必驰新技术)
那么此次思必驰新技术发布会到底给行业带来了什么?
1、远场及抗噪技术突破
在国际通用的噪声标准测试库上,思必驰的最新结构化抗噪语音识别技术刷新了国际记录,取得目前世界单系统最好成绩。模型算法的优化突破,使得思必驰仅用软件解决方案就可以达到以往采用语音降噪芯片才能达到的效果,大幅提升了识别率,降低了成本。
2、更先进的回声消除和麦克风阵列算法组合
先进的回声消除算法和麦克风阵列算法结合,可以有效的跟踪用户位置,增强语音信号质量,实现高性能的通用语音识别。软硬件结合的多种解决方案,更给出了更多的选择和可能性。仅靠软件且单麦克风条件下,通过大数据整合以及智能算法,思必驰仍然可以达到极为优秀的使用体验,识别速度与准确率均处在世界领先水平。
3、基于统计的参数化语音合成方法
传统语音合成是采用拼接技术,录制大规模的语音库,切片后在合成的时候把片段拼起来,这就往往需要大量的标准语音。思必驰采用最新的基于统计的参数化语音合成方法,可以实现模型规模的大幅压缩,语音连贯性的大幅提升,能够自由训练个性化的语音。
4、多轮交互和根据上下文的语义解析
在真实场景下,传统语音识别加自然语言处理的方案并不能很好地实现自由的“人机交互”。思必驰在领先的传统语音识别合成技术的基础上,引入交互认知智能,通过情境理解和多轮交互,面向最终任务完成度和用户体验进行系统设计和优化。
此外,本次活动上,易观智库的高级分析师封莉现场为大家揭开《智能硬件用户画像解析》,以及欧瑞博CEO王雄辉,映趣科技CEO王小彬,威仕特CEO闻政亲临现场,分享他们的产品经验。期间,思必驰还向现场预告了即将上线的一档大型活动——“创星计划”,由思必驰、FACE++、微动、ablecloud、72变、中发时代联合主办,旨在培育中小型开发者成长,推促进智能硬件领域蓬勃发展的创业孵化器计划。相关活动介绍,可关注72变智能硬件推荐平台。据悉,该活动将于8月中下旬正式启动。
(易观高级分析师 封莉)
(欧瑞博CEO 王雄辉)
思必驰信息科技有限公司作为国内最顶尖的智能语音解决方案商。认知型的对话技术是语音交互的发展趋势,智能硬件更是语音交互的爆点。此次新技术的发布,不仅给行业带来一场革新,更是对现今“智能硬件”所谓之“智能”进行的一次重新定义!