导读:3月8日,谷歌为其包括Google Home Hub、Lenovo Smart Display、JBL Link View和LG XBOOM AI ThinQ WK9在内的带屏智能音箱添加了持续对话(多轮交互)能力。
3月8日,谷歌为其包括Google Home Hub、Lenovo Smart Display、JBL Link View和LG XBOOM AI ThinQ WK9在内的带屏智能音箱添加了持续对话(多轮交互)能力。以解决用户在与智能语音助手交互时需要多次使用唤醒词进行唤醒的问题。
据悉,这一功能是谷歌在2018年5月I/O大会上针对Google Assistant与“打电话”技能一同发布的技能。在发布会上,谷歌CEO Sundar Pichai曾表示,他希望谷歌的智能助手可以自然地与人进行交谈。“用户现在可以与Google Assistant对话时,如果你想问一个问题,你可以不断询问,而无需反复说出「Hey Google」唤醒词。”
据雷锋网了解,这一功能此前已经应用到谷歌的Google Home、Google Home Mini和Google Home Max不带屏幕的智能音箱上。在推出时,首先针对美国智能音箱用户进行了配置。具体功能方面,谷歌官方给出的解释是:Google Assistant在听到唤醒词或回复用户问题后,将保持唤醒状态等待8秒。
智能音箱技能不断增加,市场销量稳步上升
智能音箱走过五个春秋,整个市场开始稳步增长。
在技能方面,智能音箱已经基本能够实现与用户的日常交互,包括查天气、讲故事、 听音乐,甚至带屏智能音箱也能够加入视频类功能。
根据Voicebot统计数据显示,2018年谷歌的智能语音助手Google Assistant开放给美国用户的技能数量为4253项;Alexa开放给美国用户的技能数量为56750项。
在国内,据阿里天猫精灵在2018年3月春季发布会上公布信息显示,天猫精灵系统中,目前已经拥有356款技能,有6500名开发者在围绕天猫精灵做新应用的开发;据百度在2019年2月小度战略发布会上公布的数据显示,DuerOS语音技能数量1000+,开发者数量达到27000+。
由此可见,智能音箱在拥有的技能方面已经逐渐涵盖用户日常生活、休闲,甚至部分学习的需求。
也由此,智能音箱也得以卖个好销量。据此前市场调研公司Strategy Analytics公布的2018年第四季度全球智能音箱市场报告显示,2018年第四季度,全球智能音箱市场出货总量为3850万台,环比增长95%。其中,排名前五的依然为亚马逊、谷歌、阿里、百度、小米,出货量依次为1390万台、1150万台、280万台、220万台、180万台。
智能音箱“变种”频生
智能音箱的市场向好也带来了诸多“变种”,从最初的智能音箱,到带屏智能音箱,再到融合电视场景。
相较而言,智能音箱被视为入口级设备,也是巨头玩家争夺的战场。包括国内诸如阿里、百度在内的巨头厂商,已经明确价格补贴的打法,腾讯、华为虽然起步在这一领域起步较完,但也已经推出自家智能音箱。包括国外巨头厂商在2018年推出智能音箱时,定价策略也略有调整。
与此同时,智能音箱的变种成为一种常态。以包括亚马逊、谷歌、阿里、百度等国内外巨头均已布局的带屏智能音箱为例,在经过近两年的市场推广和用户体验,市场反馈已经从最初的质疑转向普遍接受。
雷锋网在针对此类带屏智能音箱进行长时间的使用和体验后发现,其实带屏智能音箱在功能上与平板电脑的「娱乐」功能为主略有差异,带屏智能音箱现在仍以语音、视频类功能为主,更趋向「休闲」调性。
此外,为了强调语音功能和培养用户使用语音的习惯,诸如视频类应用也与平板及电脑略有不同,舍弃了相应键鼠操作功能,更多依赖语音控制。以小度在家1S上的爱奇艺界面为例,舍弃了诸如侧栏的导航栏,VIP账号登录也需要通过手机扫码进行授权登录。
智能音箱的另一类变种是结合电视应用场景的魔盒。2018年5月,阿里巴巴达摩院人工智能实验室和优酷联合推出天猫精灵魔盒;2018年9月,百度与爱奇艺、歌华有线联合推出歌华小果;2019年2月,百度发布小度电视伴侣。
以最近发布的小度电视伴侣为例,官方给出的功能解释标签为「Hi-Fi家庭影院+高性能4K机顶盒+高端人工智能音箱」三合一。电视打开时,可以作为语音控制的机顶盒对电视进行语音控制;电视关闭后,小度电视伴侣也可以作为「智能音箱」进行应用,包括查询天气、播放音乐等基本功能。
这些智能音箱的“变种”作为同样以语音功能为核心能力的智能硬件,最核心的需求自然也是理解能力,以及流畅的交互能力。
多轮交互问题亟待解决
在这样的产品带动和市场推广下,智能语音系统也在逐渐普及。而被视为下一代交互方式的智能语音系统其实目前虽然已经能够实现基本的交互功能,但是在交互的流畅性,尤其在多轮对话能力上尚待提升。
其实,各大厂商也早就这一能力进行研发和适配。据雷锋网了解,在谷歌之前,亚马逊于2018年3月为其智能语音助手Alexa添加了名为「后续模式」(Follow-Up Mode)的新技能,也正是用于解决这样的问题,通过后续模式,Alexa会在回复用户问题后保持唤醒状态等待5秒,看用户是否有其他问题;强行让Alexa重新进入待机状态可以使用「thank you」或「stop」这两个词来结束对话。
相对而言,国内智能音箱的多轮交互能力稍有滞后,据雷锋网此前对多个品牌智能音箱进行适用,某些品牌音箱也只是针对部分问题在回答后会等待第二轮交互,多数情况下,仍需多次使用唤醒词进行唤醒。不过,据此前景鲲透露,百度今年晚些时候会发布DuerOS针对交互能力的能力提升,针对现在需要频繁使用“小度小度”唤醒词才能唤醒的智能音箱,交互体验将会进一步得到改善。
智能音箱如果想要变得更智能,首先要解决都就是沟通障碍问题,如何通过语义理解,使得智能音箱更好理解用户问题,并在适当时候等待下一轮交互,从而实现更自然的沟通则是现在亟待解决的问题。
毕竟,唤醒词这东西,用多了也是很烦的……