可视化智能音箱如何成为2019年新的增长点?

  导读:带屏智能音箱在2018年第四季度占总出货量需求的10%以上,预计到2019年它们将成为市场增长的重要推动力。


  从亚马逊推出第一款带屏智能音箱Echo show 以来,关于带屏智能音箱的讨论就没有停止过,除了屏幕外,带屏智能音箱与智能音箱还有区别吗?它们之间相同的技术又是什么?带块屏幕的智能音箱真的有市场吗 ?


  据Strategy Analytics的最新研究显示,2018Q4出货量增长了95%,达到3850万台。这超过了2017年的总量,并使2018年的总量达到8620万台。


  Strategy Analytics总监大卫沃特金斯评论说:“智能音箱和带屏智能音箱在过去的假日季节再次成为最受欢迎的技术产品,我们估计全球有超过6000万家庭拥有至少一台设备。”


  “谷歌的Home Hub,亚马逊的Echo Show和百度的小度在家等带屏智能音箱受到消费者的欢迎,他们被视听结合的刺激所吸引”。


  带屏智能音箱在2018年第四季度占总出货量需求的10%以上,预计到2019年它们将成为市场增长的重要推动力。


  也就是说,带屏音箱不仅有市场,还会成为2019年智能音箱新的增长点。


  无屏的智能音箱让大家的生活进入语音交互的场景,而带屏智能音箱则是语音+视频交互的又一次场景升级。


  那么,除了屏幕以外,带屏智能音箱与智能音箱还有没有别的区别呢?它如何成为2019年新的增长点呢?要想回答这个问题,先来看看国外的带屏智能音箱是怎么样的。


  国外带屏智能音箱


  Amazon Echo Show


  2017年,亚马逊推出Echo Show,这款智能音箱有一个7英寸触控屏幕,下半部分是一个相当强大的扬声器。所有这些都放在一起,用户不仅能够清晰地接听视频电话和观看媒体,而且还能听到清脆明快的音质。


  Echo Show依旧搭载了亚马逊的Alexa语音助手,所以你可以给它几乎任何你想要的命令。例如,播放歌曲,电视节目,设置计时器,在日历上创建活动。


  与亚马逊最早发布的echo不同,echo show 最大的卖点自然是它的7英寸触控屏,而且还配备了英特尔凌动处理器以及前置550万像素摄像头,可与其它的Echo Show用户进行视频通话。


  值得一提的是,echo show 和去年推出的第二代echo show 使用的都是8麦克风阵列,亚马逊设备和服务副总裁大卫·利姆普(David Limp)称,这是所有Echo设备中最先进的麦克风阵列,这意味着其可以实现更优秀的噪声屏蔽,更好地听到用户发出的指令。


  Amazon Echo Spot


  亚马逊还推出了一个带有小显示屏的Echo Spot,它的屏幕只有2.5英寸(480×480像素),在屏幕的顶部有一个摄像机的空间,整个设备的顶部有三个按钮,它们都与表面齐平,形成真正流线型的外观。


  这款智能音箱几乎可以放在任何地方,比如,厨房的一个角落,床头柜等。虽然这款智能音箱很小,但是它内置亚马逊自己的Alexa语音助手,所以用户仍然可以用它进行视频通话和观看视频。并且,它也可以做任何其他语音助手的事情。用户可以设置一个计时器,询问天气,播放电影等等。


  尽管这款智能音箱很小,但是,它采用的是环形4麦克风阵列,因此,在语音唤醒方面并不逊色。


  Google Home Hub


  去年10月,谷歌召开硬件新品发布会,会上,谷歌发布了3款硬件产品,其中就包括了Google Home Hub。


  Google Home Hub是谷歌推出的首款带屏智能音箱,配备了7英寸LCD触摸屏、远场麦克风、环境光传感器以及15W扬声器,支持蓝牙5.0,并配发了绿、粉、白、深灰四种颜色。


  Google Home Hub内置谷歌语音助手,用户可以通过它语音获取日历、通勤信息、提醒以及其他个人信息。用户还可以在Google Home Hub上观看YouTube、YouTube TV以及其他视频服务。


  不过,与其他带屏智能音箱颇为不同的是,谷歌这款带屏智能音箱并没有内置摄像头,也不能进行视频通话,这是谷歌对于隐私考虑的结果。


  值得一提的是,这款带屏智能音箱是一个控制中心,它有一个新的家庭控制仪表盘(Home View),可以让用户看到家中智能门锁、摄像头、恒温器等的状态。


  Facebook Portal


  也许是带屏智能音箱刮的风太大了,连声称自己不会成为一家硬件公司的Facebook也坐不住了,去年10月,推出了一款带屏智能音箱Facebook Portal。


  Facebook推出的整个硬件系列包括两款产品,即199美元、10英寸的Portal和349美元、15.6英寸的Portal Plus。


  Portal系列带屏智能音箱内置了亚马逊的Alexa语音助手,环形4麦克风阵列,除了大屏幕外,最大的卖点就是它的广角摄像头。


  广角摄像头采用了人工智能技术,可以识别身体形状,从而实现自动对焦,始终让用户处于画面之中,而无需调整设备角度,这个技术可以让用户在进行视频聊天随意走动,更加地方便。


  关于Portal的另一个特点是,当用户不在通话或观看某种媒体时,Portal可以通过用户的Facebook个人资料幻灯片显示用户最喜爱的照片和视频。


  JBL Link View


  去年的CES展上,JBL联合谷歌推出带屏智能音箱Link View,JBL Link View配有一对10W扬声器和一个8英寸触摸屏。它还有一个500万像素的前置摄像头,带有高清视频录制功能。内置Google智能助手,而不是亚马逊Alexa。


  JBL Link View的一个特点就是配备了相当不错的屏幕,但内部没有很多清晰度或清晰度,但是仍然可以使用它进行视频通话,观看视频等。


  然而,JBL Link View真正突出的地方在于它的扬声器。JBL以制作高质量的扬声器和音响产品而闻名,因此,电影,音乐和其他媒体在这款智能音箱上会听起来非常棒。


  其实,看了一圈国外的带屏智能音箱,目前,带屏音箱最大的卖点就是可以视频通话,观看视频,最多的使用场景还是在家庭,并没有探索出更多的落地场景,也就是说,目前来看,和不带屏的智能音箱并没有本质的差异。


  如果用户家里已经有了智能音箱,那么,再次购买带屏智能音箱的可能性就会很小,因此,在2019年,带屏智能音箱需要做出更大的差异化,能让用户根据个人需求进行个性化定制,能扩展出更多的应用场景。


  在技术上看,不管是智能音箱还是带屏智能音箱,最重要的技术之一都是麦克风阵列。


  麦克风阵列


  麦克风阵列是一种功能与普通麦克风类似的麦克风设备,但它不是只有一个麦克风来记录声音输入,而是有多个麦克风来记录声音。简单来说,就是麦克风的排列组合。


  麦克风阵列一般来说有线形、环形和球形之分,严谨的应该说成一字、十字、双L、平面、螺旋、球形等。


  麦克风阵列可以根据需要或希望记录声音输出而设计成包含任意数量的麦克风,具体来说,可以有2个到上千个不等。


  然而,由于成本限制,消费级麦克风阵列的数量一般不超过8个,所以市面上最常见的就是6麦和4麦的阵型。


  麦克风阵列对智能音箱至关重要,它的作用主要是语音增强、声源定位、去混响、单或多声源定位等。


  亚马逊最早推出的智能音箱Echo就是环形6+1麦克风阵列,而它推出的第二代Echo依旧延续了第一代麦克风的设计,2017年推出的Echo show 则多加了两个麦克,为8麦克阵列。从上述图表可以看出,智能音箱大多都采用6麦克风阵列,采用双麦克阵列的较少。


  使用双麦克阵列最典型的智能音箱是Google Home,2016年,谷歌推出Google Home,与Amazon Echo相比,最大的区别就是麦克风阵列,Amazon Echo采用的是环形6+1麦克风阵列,而Google Home只采用了双麦克阵列。


  与多麦克风相比,双麦克风有它的缺点,主要是声源定位只能定位 180°内的范围,而环形麦克风阵列(不管是 4Mic、6Mic 还是 8Mic)都可以做到 360°全角度范围内的定位。


  与此同时,麦克风越多越容易实现更好的降噪和语音增强效果,手机和蓝牙耳机上的降噪功能可以使用双麦克阵列,因为距离近,受噪声干扰小。


  但是,智能音箱的使用场景大多在家里,环境嘈杂,距离又远,在定向声源信息,抑制无关噪声,保证真实环境的语音识别率方面,双麦克与多麦克相比,效果肯定会大打折扣。


  在国内,多麦克风阵列也已经是智能音箱行业的“标配”,市面上大热的几款智能音箱,都是多麦克阵列,例如,阿里天猫精灵X1、华为小艺小艺、小米小爱同学采用的都是环形6麦克阵列,这样的麦克风阵列可以更好地实现语音唤醒、声源定位等功能。


  要想更好的接收声音,抑制噪声,麦克风阵列中的麦克风匹配至关重要,需要考虑三个方面:方向性、灵敏度和相位。


  方向性——麦克风的方向性是指它可以从哪个方向接收声音。麦克风是用来接收来自特定方向的声音的。有些麦克风只能接收单向的声音。还有一些麦克风是用来接收来自四面八方的声音,全方位的麦克风。


  在构建阵列麦克风时,所有麦克风必须具有相同的方向性。一个麦克风只能接收来自某个方向的声音,而另一个麦克风只能接收来自各个方向的声音,这将导致灾难性的、不平衡的录音。


  除非有某种独特的情况会出现这种情况,否则这在很大程度上是不可取的。因此,麦克风阵列总是使用相同方向的麦克风。


  灵敏度——灵敏度是麦克风阵列必须匹配的另一个方面。灵敏度是麦克风在记录信号时获得的增益。在麦克风阵列设备中,灵敏度必须非常匹配,否则一个麦克风的声音会比另一个大,从而产生不平衡的录音。


  相位——相位是麦克风阵列必须匹配的最后一个重要方面。相位是麦克风开始录音的时间的参考度线,也就是说,它决定了阵列中所有麦克风开始和停止录音的时间。


  如果麦克风有完全不同的相位,它们将在不同的时间记录信号。这将导致不同步的记录,同样,这在很大程度上是不可取的。


  麦克风最好能同时记录信号,这样信号之间就不会有延迟。就像灵敏度一样,麦克风之间的相位差必须有一个最大的允许公差。这种差异通常是±1.5度,确保信号记录同时,可以统一记录。


  在万物互联的今天,麦克风阵列技术已经越来越多地被应用到消费领域,随着智能车载、智能家居、机器人、可穿戴设备等热潮的兴起,语音交互越来越被用户所习惯,麦克风阵列自然也成为其中非常重要的前端技术。


  总体来说,机器人、智能家居行业尤其是智能音箱,采用的以多麦克居多,这是因为,虽然多麦克相较于双麦克成本高,但是,在降噪和语音增强方面,自然是麦克数量越多效果越好。


  结语


  亚马逊带头推出带屏智能音箱,国外的谷歌、Facebook,国内的BATJ等也纷纷迎头赶上,推出自家的带屏智能音箱,智能音箱大战也由此进入了第二阶段。


  但是,需要注意的是,目前的带屏智能音箱都大同小异,无非是屏幕的大小、麦克风阵列的选择、接入资源的多少等差异。


  当下,带屏智能音箱的主要场景还是家庭,希望在未来,带屏智能音箱可以拓展更多的应用场景,可以实现基于用户需要的个性化定制。


精彩推荐