智能家居这个概念虽然已经出现了几十年,但是因为技术发现的显示和市场需求的原因,一直属于一个小众行业,直到近几年来资本的推动才它慢慢变得火热起来,就在许多设备厂商都习惯了以手机作为智能家居控制终端的时候,有一批人偏偏想要打破这个“传统的”做法——他们想要做的,是通过语音识别技术把一款无线音箱改造成为智能家居的“控制中枢”。
于是在今年3月,京东和科大讯飞签署了战略框架协议,开始在智能家居领域进行全面的战略合作,其中科大讯飞提供云技术和云交互等方面的技术,京东则提供销售渠道和JD+的平台,叮咚智能音箱便是这两者的强强联合的第一个产物。
它能做什么?
传统的音箱需要通过按键,触摸屏等进行交互,叮咚音箱则通过语音识别进行交互,无需使用双手,就可以对音箱本身的功能或音箱所连接的JD+平台上几乎所有的智能设备进行控制,甚至我们可以通过音箱可以进行一些对话聊天和一些百科问答。
与其他语音助手可以进行连续对话不同,和叮咚智能音箱进行的每一句话都必须先叫一次唤醒口令”叮咚,叮咚“(也可以设置成其他语音)将其唤醒,这时它的顶部就会亮起一圈蓝色的灯,并在语音传来的方向发出高亮,就像个猫头鹰一样把耳朵转了过来在聆听。这样设定的好处是,它不会被我和别人的交谈或者电视剧的声音随意唤醒。
我可以说:”叮咚叮咚,明天会下雨吗?“来查询明天的天气,也可以说:“叮咚叮咚,给我放一首周杰伦的歌”来随机听一首周杰伦的歌。如果家里有可以与JD+平台的智能电视的话,我甚至还可以说:”叮咚叮咚,我要看中央5台。“来切换正在播放的电视节目。
作为一款音箱,主要的功能是用来听音乐,所以音乐内容是必不可少的。此外,音质也是追求高品质生活的人们所的需求的另一重要方面。
“叮咚智能音箱在后台接入了一千万首高品质的歌曲,400万小时有声读物和1000个广播电台,可以满足不同年龄层次不同用户的需求。为了拥有高品质的音质,叮咚智能音箱配备4个全频喇叭,可以进行360度声波的均匀传送,并具有1个低音单元,可以让高品质音乐得到完美的体现。”魏强博士说道。
为什么是音箱这种产品形态?
对于智能家居的中枢的基本功能和形态,灵隆科技的团队琢磨过很多种类,最后发现只有无线音箱这种形态最能满足他们最初对产品的设想和消费者的需求。
“我们做产品定义的时候,实际上也考虑了很多方向,但从目前绝大多数用户家庭的普遍状况来看,离建立完整的智能生态系统还有非常大的距离,让他们单独购买一个纯概念中枢为时过早。”灵隆科技硬件产品中心总监魏强说道。“在基本功能选择的时候,我们也考虑过非常多的形态,包括视频播放盒子、甚至扫地机器人等,最而使用音箱这种产品形态,是因为现在目前中国的家庭里面,我们有电视、有空调、有冰箱等各种各样的的产品,但是在声音方面,用户大都是用的有线音箱,而像蓝牙和Wi-Fi音箱在中国的家庭用户中的普及度比较低,所以才选择了无线音箱这种实用而重复性较小的形态。”
在设计中遇到了哪些挑战,是如何解决的?
作为一个语音识别装置,首先要做到的就是对于目标语音信号高灵敏的检测和对噪音源的抑制,而对于音箱这个发声装置,想要在播放音乐时依然能够接收语音指令,还需要进一步实现播放状态打断功能。
由于叮咚音箱具备低音单元,在大音量播放立体声音乐的时候,会让音箱本体的发生震动,造成一些非线性的现象,在这种情况下,传统线性原理的回声消除技术就失去了作用。
为了解决这一难题,叮咚音箱的喇叭采用全对称的设计,减少对麦克风的回馈。其次麦克风采用了双缓冲减震的设计,尽量避免喇叭震动带来的非线性回声出现。最后也是最重要的一点,叮咚音箱使用了阵列麦克风的技术,先对喇叭的方向噪音进行一定程度的抑制,在这个基础上再进行回声消除,就容易的多了。
对于语音控制设备,还有一个挑战就是远场声音识别,语音会随着传播距离的增大而有着指数型的衰减,叮咚音箱的八个麦克风阵列就可以起到大作用了,这样的设计可以做360度的音源拾取,通过阵列的形成技术,在空间形成若干个识音区域,然后把音源能量最大的方向定位为目标说话人的方向,相当于锁定了声源位置,再加上回声消除技术,这样就可以让叮咚音箱在5米左右的距离听写识别率超过99%,并在100dB音乐播放过程中实现90%语音打断唤醒率。“其实我们每一个逆向工程,反过来看都是比较简单的,但是实际上要从零做起的话,挑战还是非常大的。”科大讯飞智能终端业务线总监谢信珍说道。
总结:
从功能方面来看,叮咚音箱难免会让我们想起亚马逊的Echo,但相比之下,叮咚音箱在硬件配置和价格方面有着明显的优势,而且叮咚音箱在本土作战,拥有着科大讯飞的语音识别技术,并背靠京东微联这个大树,也更接地气。不过叮咚智能音箱若想走出国门的话,要走的路还很长。