如今,我们对虚拟语音助手已经十分熟悉。无论是苹果 Siri、亚马逊 Alexa,还是百度小度,阿里巴巴天猫精灵,在提供帮助之余,还经常扮演着被无聊人类调戏的对象。 就在你来我往的博弈之间,语音助手们练就了一身反调戏的本领,甚至还会出其不意,给你惊喜。 但如果把苹果推出 Siri 视为消费级虚拟语音助手诞生元年,算下来迄今已经过了近九年,要说它们没什么长进,恐怕是冤枉了。只不过,跟它们对话似乎总是差点意思。 当然,如果只是指示语音助手设置闹钟,查询天气,它们在绝大多数情况下都能完美实现。然而一旦脱离具体任务,以聊天或咨询为主要目的,因为涉及到对话和交互能力,它们的表现就会一落千丈,经常会出现前言不搭后语的情况,令人沮丧。 为了改善这一问题,Facebook AI 近日就公布了一项最新研究成果:拥有 94 亿参数的开源 AI 聊天机器人 Blender。 Facebook 研究人员声称,Blender 是迄今为止“最先进的”聊天机器人,可以以有趣和连续互动的方式讨论几乎所有内容。在人-人和 Blender-人的对话比较测试中,有 49% 的测试者把 Blender 的对话记录误认为是人和人的对话,67% 的测试者认为 Blender 和人的对话更像是人和人的对话。 “对话有点像 AI 完备问题(AI-Complete),你必须要解决所有 AI 问题才能解决对话。反过来,如果解决了对话问题,所有 AI 问题也就解决了,”Facebook工程师 Stephen Roller 表示。他认为,研究开放式聊天系统将有助于提升虚拟语音助手的交互能力。 有意思的是,今年 1 月底,谷歌 AI 刚给自家的聊天机器人 Meena 冠上了相似称号。当时,为了衡量 Meena 的水平,谷歌研究人员发明了名为感知性和特异性平均值(Sensibleness and Specificity Average,SSA)的评估标准。 该基准给人类真实对话的评分是 86 分,而 Meena 获得了 79 分,位居第二名,并且远胜于 Mitsuku 和微软小冰等同类聊天机器人。“最先进聊天机器人”由此得名。

