ROOBO钟升达:如何从0到1打造爆款儿童机器人

  儿童智能机器人的诞生解决了很多儿童陪伴的问题。作为一个在百科中还没有收录的词条,「儿童智能机器人」已经发展到什么阶段?什么样的机器人才算一个合格的「儿童智能机器人」?


  本期《机器人大家说》邀请到了北京智能管家(ROOBO)儿童机器人产品总监 钟升达,他将结合ROOBO目前在「儿童机器人」领域的探索,为大家带来「如何从0到1打造爆款儿童智能机器人」的主题演讲。以下为文字实录:



  儿童机器人与AI的行业发展回顾?


  如往期一样,在了解儿童机器人目前的整体现状和如何打造一款合格的儿童机器人前,我们需要先了解一下这个行业的历史进程与发展


  “儿童机器人”这个概念目前其实还算比较小众,甚至在百科上都没有一个具体的词条能够完整描述它。也就是说,儿童机器人仍然没有一个合适的定义。


  因此,想要了解这个行业,我们需要从产品入手,以产品共性看待行业。我们发现,所有的儿童机器人产品现在都有一个重要的功能特点,那就是需要倾听儿童的声音,并和他们交流、互动。所以,这类产品最核心和关键的技术就是智能语音技术。而这,恰恰离不开人工智能的第三次浪潮。



  从06年诞生深度学习理论技术后,短短5年时间语音识别和图像技术便迎来了商业化时代。以2011年为节点,微软率先使用深度学习,将语音识别正确率从75%提升到95%以上。随后,讯飞输入法、SIRI这样的智能助理诞生。


  最早的儿童智能机器人雏形则来源于语音识别鼻祖讯飞的一款应用APP《开心熊宝》。这是基于手机的一款软件,而对于硬件来说,2014年一家国外的公司打造了“JIBO”的硬件产品,很遗憾地,它并没有得到量产的机会。


  如今我们有着很多公司在共同耕耘儿童机器人市场,不论是最初的乐橙公司、小鱼在家还是如今的北京智能管家ROOBO,多多少少在设计及理念上都借鉴了他们的“老大哥”JIBO。


  在各家公司纷纷进入儿童机器人市场的2015年,整个行业也开始腾飞,从不足10万的年销量,发展到3年以后的2018年预估2000万销量。这样的井喷效果不仅来自于硬件成本的降低,其次也有故事机、早教机产品转型带来的影响。


  儿童机器人1.0时代:同质化产品当道


  作为一个拥有潜在销量2000万的市场,大家普遍都会认为儿童机器人产品销售一定拥有“快速增长性”和“蓝海”的特点。


  然而并不是这样。外行会认为儿童机器人市场像是广阔蓝海,而从业者都深知他们所处的环境只是一个小小的鱼塘,并且竞争非常激烈。


  这是因为,第一,父母对儿童机器人产品的认知度依然不高。父母及孩子,乃至我们广大消费者,在被各种影视作品及通俗文化的影响下,都会认为:


  “儿童陪伴机器人”=哆啦A梦或大白


  第二,尽管两种产品在品类上毫不相关,智能音箱的“千机大战”以及各种巨头补贴在不断冲击着儿童机器人市场。这主要是因为生产者在产品编辑上处理较为模糊。


  你能分得清谁是儿童机器人吗?


  作为主打儿童智能语音交互的产品,儿童机器人的核心应当是“技能和场景”。目前各种平台也在不断拓展着它们,我们总结来看,其实不外乎两类。


  第一类是工具型,比如咨询天气、其它生活信息或常识信息。第二类是资源点播型,比如听儿歌,听故事或者看动画片。


  对此这些技能和场景,ROOBO专门梳理了用户在使用它们时所占据的比例。



  根据这个分析,我们可以得出在目前的儿童智能机器人时代,钟升达称之为“儿童智能机器人1.0时代”,无论从产品外观、内沿竞争或者功能体验上来讲,各家产品都处于一个非常同质化的阶段。


  那么在同质化的竞争状态下,北京智能管家ROOBO以及行业内所有的儿童机器人企业该如何去打造差异化、有特点的机器人呢?


  如何打造2.0时代的差异化儿童智能机器人?


  深耕行业多年,北京智能管家ROOBO在积累了大量经验的情况下,于今年7月推出了从软件到硬件统一的开放平台——“童秘平台”。



  “童秘平台”的开放性来自于它可以适配各种系统,如业界常用的安卓系统、Linux系统,以及RTOS系统。同时,在对接硬件方案伙伴上,ROOBO也将内容云这一层面开放出来,以实现更多有价值的、富有教育意义的内容覆盖。


  除了平台与内容外,最基本的语音对话方面,ROOBO在2.0时代总结了百度先前提出的标准,即“听清”、“听懂”、“满足”。


  这三个方面对于成年人来说,似乎很好实现。然而对于儿童来讲,他们正处在学习语言的阶段,小到发音、大到语言逻辑的各种形式都是非常复杂的。


  通过大量的语音标注,以及结合最新的声学模型TDNN神经网络,ROOBO重新训练生成了专门针对垂直于儿童领域的ASR语音识别技术。至此,ROOBO实现了差异化的第一个点:听清。


  对于“听懂”,在大部分常见的用户对话中,用户的意图遵循着“二八定律”,就是说80%的用户,其对于产品功能的表达方式会集中在20%的话术上。比如说暂停歌曲,普通成年人用户会说“暂停”、“不要播了”、“停下来”等,而儿童却不这样,也是和儿童的语言逻辑相关的,他们会认为机器人并非工具,而说出“你这个歌可不可以自己停呀?”这样的话语。


  这种拟人化的语言如果用传统的智能语言模板匹配很难会命中儿童的真实意图。在这方面ROOBO又结合另外的LSTM模型进行大量标注,实现了儿童自然语言处理的神经网络。此外,他们也围绕产品端进行了定制化的迭代,保证时刻更新儿童语料。


  最后一个阶段是“满足”,这一方面ROOBO和众多内容合作伙伴一起打造了知识库,将目前市面上的内容知识形成体系输出给广大儿童。


  其实,仅仅包含“听清”、“听懂”和满足,儿童智能机器人仍然和智能音箱无法形成有效差异化。


  对此, ROOBO给出了一个绝佳的方式。因为儿童正在处于语言学习的关键时刻,只是“磨耳朵”对于他们来说帮助不大,这是一种输入。更有效的互动应当是输入与输出相结合。


  因此ROOBO给孩子们提供了“磨嘴巴”的功能,即是由机器人在和孩子交流的过程中根据内容主动发问,例如当孩子提问:“你有家人吗?”机器人回答:“没有,我是机器人,你有家人吗?家里有几口人呢?”


  通过一些具有条例和逻辑的回复,锻炼儿童的语言意识。这就是2.0时代的关键——围绕语言的主动交互。


  关于儿童机器人的未来



  这里,具体在三个趋势上面会有所表现:


  一是IP化,比如一些家喻户晓的动漫形象,如小猪佩奇、小黄人等,以此增强产品的认知度。


  二是内容互动多元,就如上面讲到的,机器人会主动引导孩子表达,之后孩子也会发表他关于上下文的想法,以此实现教学性的互动。


  三是未来的儿童智能机器人一定是既能听又能看同时具有更强感知能力的产品,它可以有效监督,或者督促孩子学习。


精彩推荐