机器人逐渐崛起 但情感计算还不过关

  让机器人成为电影《Her》中的人工智能伴侣似乎还有点远。在大众消费市场,与机器人的语音互动常常以“我不太明白你在说什么”终结。Alpha-Go、深蓝这些机器学习的尖端算法技术和知识,在计算机后台形成了丰富的资源,但如果不能跟人类交互,其价值远远不能算被充分开发。


  现在,情感计算正在帮助完成人机交互这一命题,充分挖掘人工智能技术可能为人类创造的价值。也许在不远的将来,拥有《超能陆战队》中的“大白”不是梦,更多场景将会有它们陪伴。



  人工智能背后的情感经济


  “AI对我们的定义不仅仅是大数据和算法,还有模拟人的行为方式,能够理解到人讲话的意图,只有语义的理解还不是真正的AI,还包括自然元素里的情感、意图的理解。”在由《商业周刊/中文版》主办的“展望2017”峰会上,竹间智能科技创始人兼CEO简仁贤告诉记者。


  作为微软(亚洲)互联网工程院前副院长,简仁贤曾负责微软小冰及小娜产品技术的研发,情感计算是其目前研究的重点领域。根据用户文字或语音对话输入,深度理解对话主题、意图与情绪,并结合上下文与对用户的记忆,进行合情合理的回答,这是情感计算最主要的意图。


  早在2012年,受西班牙财政危机的影响,一家巴塞罗那喜剧俱乐部的夜场观众流失了三分之一,为了提升上座率,这家喜剧俱乐部别出心裁地采取门票免费但按照观众观看时的笑容数来收费,结果客源提升了35%,收入也相应增加,负责识别和统计笑容数量的技术就来自于一家名为Affectiva 的公司。


  读懂、听懂、看懂


  这是情感计算的一个片段。在简仁贤看来,要做好人机交互,首先机器人要能够做到读懂、听懂、看懂。


  所谓读懂就是要解析一句话背后的情感、情绪、心情、感觉,通过搭建情绪模型,并进行深入分析得到答案。此外,对话聚焦主题,并判断出语言背后的语言行为也是加深理解的重要方面,比如判断这一语言是咨询问题,还是询问意见。


  看懂,不仅需要理解自然语言、搭建对话系统,更重要的是机器视觉、人脸识别上的技术成熟。精准识别面部表情与动作,能够判断一个人情绪变化、情感变化和注意力变化,并能够在多样场景上应用。例如一个人走进一个商场,机器如果能够识别出是紧张的状态或是愤怒的状态,就能为安保工作带来积极效果。


  听懂则更聚焦在语音识别技术上。同样的话用不同的语调表达,往往能传递不同的意思,高兴、无奈、愤怒,都是语音能够传递的不同情感。


  简仁贤认为要实现上述目标,类脑对话机器人、机器视觉、语音情感、多模态情感计算成为四个可发展的基础支撑技术。“多模态情感计算即对语言、声音、图像进行综合计算分析,得出背后的文字情感、语音情感和面部情感的综合结果。” 简仁贤解释道。


  精准地判别意图,才能完成任务。如果一个机器人只能闲聊,就达不到研发者要建立的黏性跟互动。简仁贤把目前市场上存在的对话机器人分为三类——只会瞎聊的、指令式的、只懂垂直知识的。


  当前对话机器人的普遍问题,就是局限于关键字、词的处理,单句问答,不能理解上下文。实操过程中,只能用“人工”来处理指令,让机器人们显得不那么“智能”。


  没有记忆也被认为是机器人对话过程中的顽疾。没有记忆,就不能积累交流对话中获取的信息,即不能对人产生一个完整、全面的数据画像,不存在产生理解人喜好、习惯、语言、行为意图的基础,就无法做到最人性化、个性化的对话,进一步无法理解人,陷入一个死循环中。


  借助场景定制落地


  既然情感机器人能够理解个人行为和商业行为的意图,那通过抽取不同领域内不同的意图,就可以使未来的机器人达到高度定制化。


  实际上,情感机器人就是实现定制化机器人的技术基础。它能对不同环境与环境中的人进行有效理解,并完整互动,基于此进行某部分的技术放大和延伸,从而成为适应该场景的定制机器人。


  而现在市场上落地应用的机器人很多反应很迟钝,就跟无法依据使用场景定制、工程化不足有关。尽管诸多人工智能公司宣称自己的识别技术精度在95%以上,但其产品的使用体验似乎无法匹配如此高的识别精度。


  “一般你看到的识别竞赛很多都是学术研究机构的,学术跟研究离落地还很远,中间有很多细节,包括应用场景和工程上,你有可能在实验室里达到某个效果,但是时间很长,工程化的时候达不到那个效果。”简仁贤说。


  一项技术如果能制造出5种不同的应用场景,不同场景用不同技术的些微差别去推出,“扬长避短”,这就是定制的本质。


  简仁贤举例,“例如有些场景可以容忍时间比较长的辨识,那我们就用辨识度最高、时间最多的,有些场景要做到客户端里面去,就需要时间很短,误差率比较大,精准度没有那么高。场景如果允许误差比较高,那就需要在性能、成本和技术精准上面做一个平衡。落地化然后应用到不同场景,这个是AI落地必须要考量的很重要的一点,也是很多公司没有注意到的。”


  以微软小冰为代表的聊天机器人也在加入情感计算功能,在浙江大学教授张宏鑫看来,情感计算可以根据文字对话的上下文找出情绪,优化上下文处理,给出推荐内容,从而进行场景的优化。“互联网的本质是流量,通过情感因素加入可以提升用户体验,进而提升流量。但目前准确率确实不会太高,不过对于对话类的与推荐类型的应用已经足以应用了,对于定制化的场景比较有效。”张宏鑫告诉第一财经记者。


  不过打造超级情感机器人并非易事,人在决策过程中的情感往往掺杂太多不稳定因素,还需要机器做大量的学习和探索,但针对特定场景例如自闭症患者治疗、美妆领域的客户颜值测试,安全驾驶方面的疲劳度甄别等等,懂得察言观色的机器人正在走来。


精彩推荐