长期以来,只要我们一想到智能机器人,我们就会在脑海中描绘出和人的形式类似的东西。从George Lucas的C-3PO到最近开发出来的Robokind Zeno R25,走入我们视野中的机器人通常都会有两个胳膊和两条腿,而Emospark的发明人Patrick Levy Rosenthal则采用了一种不同的方式,他以一个小到可以放在你的手掌上的立方体的形式,将人工智能呈现在消费者面前。
Emospark是一个能够实现WiFi和蓝牙通信的90×90×90毫米(3.5 x 3.5 x 3.5)立方体,通过内容分析与人脸跟踪软件相结合的方式与用户进行情感的交互。除了能区分家庭成员,该装置还采用了定制开发的技术,能够区分基本的人类情感和创造它自己以及与之交互的人的情感轮廓。
“人脸跟踪技术已经很成熟,我们所做的不同之处在于用它来记录和处理不同的情绪,”Rosenthal透露,”Emospark立方体包含一个我个人发明的独特的芯片,称作情感处理单元(Emotional Processing Unit),它能让立方体在与用户进行交互时建立自己的情感剖面图(Emotional Profile Graph,EPG)。随着时间的推移,立方体会保存所有与它互动的每个家庭成员的这些情感信息,就像采集指纹一样。”
用户通过打字输入或电视交谈,或远程通过智能手机、平板电脑或电脑等与立方体沟通。通过分析这些数据,以及使用人脸跟踪技术,立方体会量测用户的喜恶和不同的情绪(基于八个主要的人类情感:快乐,悲伤,恐惧,厌恶,信任,愤怒,惊喜和期待),并开始逐渐熟悉自己的用户,。
起初,立方体通过连接和推荐如facebook和youtube等网站上的特定歌曲和视频内容来改善你的情绪和开心指数。随着立方体和用户之间关系的进一步发展,该设备将变得更加善于交谈和提供细致入微的关怀–而这被Rosenthal看作是人工智能和技术进步的重要标志。
“这里主要的突破在于开发了一个有效的模型来在机器上合成情绪,并创造了一个可以不基于脚本而是基于与人类情感频谱相兼容的系统来回答问题的机器人,”Rosenthal 说到,“这是一个能够响应自由联想测试的系统,不仅基于逻辑,也基于其在你提问时的情绪状态。”
这意味着,随着时间的推移,立方体将发展出自己的个性,这个速率将主要取决于用户与其交互的频次。“情绪学习永远不会终止,立方体会一直学习,它的EPG会随时间而改变,但是对数化的,”罗森塔尔说。“它将会在年轻时了解到更多并不断发展,而且这更多的取决于使用的频率而不是时间。”
尽管Rosenthal相信他已经创造了人工智能机器进入消费领域的基础,他仍希望通过将控制权交给开发人员来在人工智能中兴起一个非常普遍的兴趣。“Emospark立方体将会有开放的API(应用编程接口),允许开发人员以应用程序的形式在谷歌商店创建新技术模式,”罗森塔尔说,“因此,会话引擎、语音和语音识别都将是可以被升级或替换的模块,这样用户就可以制作自己的立方体了。”
Emospark立方体也可作为一个学习工具,它可以连接到Freebase,一个由谷歌所有的在线知识集,这使它能够回答超过39000000个话题。也可以用它来控制其它机器人装置,例如,为NAO机器人带来情感反馈能力或把Sphero ball变成一个有着自己情感的虚拟宠物。
该立方体支持Android系统,包含一个1.8 GHz CPU和2 GB DDR3内存以及Rosenthal定制的20 MHz EPU(情感处理单元),它还有一个内部天线,内置Wi-Fi功能支持802.11b/g/n,以及USB 2.0,microUSB和HDMI 1.4端口。
Rosenthal提到,“鉴于长久以来人们对复制我们的外形和动作的机器人的恐惧, Emospark的设计抛开了传统的仿人机器人的蓝图,这是一种有意识的战略决策。我不想要一个虚假的人,当我们看到机器人时,我们仿佛看到一堆的硅,而且危险的是机器的谎言,它们试图在告诉我们,他们是人。这就是为什么我们做了一个立方体,立方体会有自己的定律,确保它们尊重人类的期望和快乐,知道自己一个机器。”
除了美学之外,Rosenthal认为,消费级人工智能成功的核心是与机器间的情感交流能力,因为它可能有助于缓解广泛持有的对智能机器的潜力的恐惧。
“随着机器人在社会和劳动市场的作用不断增长,人类和机器可以在情感层面进行连接是很重要的,”他说。“制作这个立方体正是为了阐明可以怎样使用这种技术改善生活,并试着改变未来。”