真正千人千面、个性化定制的“法器”:声纹识别技术

ZNDS智能电视网 王日立 2017-09-21 19:18

  在物联网、人工智能技术越来越发达的时代,很多生活中原本习以为常的场景都悄然发生了变化。在线购物、扫码支付、共享单车、随身穿戴、语音交互……在越来越便捷的社会,我们告别了原本繁杂的工序和步骤,开启了更为便捷的现代生活。


  伴随着互联网的蓬勃,人们开始面临一个非常困扰的问题,充斥在互联网上的信息如海洋般丰富,如何快速查找到适合我们的信息呢?——千人千面的个性化定制应运而生。



  说到千人千面,最为用户熟知的恐怕要属今日头条。依托先进的大数据技术,为不同年龄、不同性别、不同爱好的用户推荐不同的新闻内容,打造新闻资讯的千人千面,成为越来越懂你的新闻资讯客户端,也博得了一大批用户的喜爱。


  数年前智能电视崛起,颠覆了传统电视的形态,搭载智能操作系统和视频内容,能按照用户意愿下载各种第三方app,极大程度上拓展了电视的娱乐功能,延伸了家庭电视的内涵,给万千用户带来更为新颖的视听体验。随着技术的发展和人工智能概念的应用,众多电视系统开发者不满足于仅有的“操作系统”,而是花费了更多心思用于“智能”操作系统的研发。这些“智能”操作系统不仅可以下载安装各种APP,而且拥有语音交互、在线购物、人脸识别、视频通话、AR等功能,在此基础上,进一步实现了视频内容的千人千面和个性化定制,将周到的服务体验转嫁到了电视层面。


  那么问题又来了。很多业内人士都对智能电视的个性化定制提出了疑问。电视的家庭属性非常强,一台电视属于爷爷奶奶、爸爸妈妈、儿子女儿,电视该如何判断此刻是谁在使用,该怎么为不同的家庭成员推荐不同的内容,从而实现真正意义的个性化定制。


  基于现有技术水平和电视机本身的构造,要实现能够识别用户的个性化定制,方式主要有两种:一是通过外置摄像头,达到识别人脸的效果;二是通过话筒,实现声纹识别。



  今天我们主要说一下声纹识别。


  在普通大众眼中,声纹识别和语音识别是两个很容易混淆的概念,其实二者有着很大的区别。语音识别的重点在于“听得懂说什么”,声纹识别的重点在于“听得懂是谁说”。声纹识别是一种基于人类“生物特征”的身份辨认方法,与指纹、唇纹、虹膜等一样,也被称为“活体密码”,拥有极高的安全性,例如微信就采用了声纹作为密码验证。


  为什么声纹识别有着越来越广阔的前景呢?最主要的原因是,能够使用语言是人类与动物最主要的区别之一,语言也是人类生活中最广泛的沟通方式,最天然的沟通入口,因此人类要训练机器,让机器拥有听懂和表达语言的能力,不但要听懂“说什么”,还要听懂“是谁说”,如此一来,人工智能便能成为人类的工具,服务于人,所以声纹识别成为物联网时代的风口之一。


  目前声纹识别技术的工作流程主要有两种,一种是“1对1”,可以用于密码验证、身份验证等场景,比如微信语音密码;另一种是“1对多”,这种技术比“1对1”更为复杂,因为它可以精准识别到每一位不同用户,依赖的是机器学习和深度神经网络,从而为更广阔的场景服务创造了无限可能。


  与人脸识别所需要的摄像头相比,声纹识别只需要一个麦克风,如果在电视或智能家居设备上配备,显然其成本因素更为低廉,因此也更容易受到厂商青睐。


  除微信语音密码验证外,声纹识别已经开始在智能电视或智能音箱上使用。比如9月20日暴风电视刚刚发布的AI2.0,“进一步深化对用户行为数据的收集,充分沉淀用户的使用习惯,完成对用户行为和声纹的分析,实现精准化内容推荐。针对不同的年龄段,不同性别的人群按需推荐内容,满足不同用户在家庭场景中个性化需求。”


  在暴风电视的现场演示中,通过语音唤醒暴风大耳朵后,它可以根据声纹识别出此刻正在收看电视的具体用户,从而为该用户推荐合适的视频内容,这不但增加了人与设备之间的沟通,也更符合人类语言行为习惯,让机器更懂人类,向人工智能迈进新的一步。



  除构建智能化场景服务外,声纹识别还可用于银行安保、身份验证、公安破案等具体场景,为大众带来更方便、安全的生活服务。


  当然,声纹识别也不是万能的,和其他技术一样,也存在很多局限性。例如专业级别的技术门槛,只有拥有一定专业知识的技术人员才能实现声纹识别功能;再例如周围环境的噪音问题、嘈杂的现场、数人同时说话、远场语音识别等难题,这些问题的解决绝非一朝一夕,而是需要在长久的行业磨合中,逐渐摸索出一条全面而完善的声纹识别道路,“路漫漫其修远兮”,相信在不久的未来,声纹识别一定会像如今的指纹识别一样,被大众接受、普及。


下一篇
导读 :9月是个多事月,停播风波不停断,还未播到第二期的《见字如面2》迎来下架通知,节目审查的边界到底在哪里? 昨日(9月19日)晚,播出仅一期的《见字如面2》突遭下架。目…

相关标签

相关推荐