人工智能进军说唱,初音未来、微软小冰你知道多少?
导读: 人人皆可RAP?听上去很吸引人。作为人工智能的新尝试,爱说唱获得了不少目光,毕竟没有freestyle也没问题了。那么,还有哪些人工智能已经在乐坛上出道了?
当下,说唱文化正逐渐在中国流行起来。《中国有嘻哈》、《中国新说唱》把说唱歌曲这类小众文化带到更广泛的人群面前。但对于普通用户来说,比起流行歌曲,“说唱”显然更有难度:节奏、押韵,说唱文化中的嘻哈态度都让人望而却步。
但是最近,人工智能好像为我们解决了一部分难关。
在百度上月举办的AI开发者大会上,百度副总裁沈抖携说唱歌手孙八一,发布了一款名为“爱说唱”的智能小程序:用户只需选择背景音乐,然后随便说出一段话,就可自动生成一段堪比专业的RAP歌曲。
人人皆可RAP?听上去很吸引人。作为人工智能的新尝试,爱说唱获得了不少目光,毕竟没有freestyle也没问题了。那么,还有哪些人工智能已经在乐坛上出道了?
今天我们就来盘点一下那些AI歌姬们。
初音未来、洛天依
说起“虚拟偶像”,几乎所有的宅友们脑海中跳出的第一个名字便是“初音未来”,作为世界上第一个举办演唱会的虚拟歌手,世界第一公主殿下的名号可以说是响彻云霄。
初音未来,是2007年由Yamaha的VOCALOID系列语音合成程序为基础开发的虚拟少女偶像。
对,你没有看错,这个葱色双马尾辫的少女的缔造者,是雅马哈。事实上,看起来“不务正业”的雅马哈除了生产摩托车以外,还是世界上最大的音乐乐器的生厂商,其中就包括了音乐合成器。2004年,雅马哈开发了电子音乐制作语音合成软件核心引擎VOCALOID,就是初音未来和她的中国风妹妹洛天依的核心。
根据目前主流的语音合成方式,Vocaloid采用的是“拼接合成”技术,使用者可以通过输入歌词和音符的方式直接生成歌曲,而歌曲的基础声音数据则来自于配音演员。
如果需要创作一首新的曲子,使用者需要规划歌词和音调,编辑歌词和音调。并且可以更改每一个音符,对生成的"唱词"进行各项微调,包括呼吸力度、口的开合甚至颤音,通过这些调整,就可令原本破碎的声音数据变为连贯的类人电子声音。
采用这种方式来创作,可以实现对歌曲最精确的控制,但另一方面,也很需要作者调整各项参数的功力。
微软小冰
不同于初音未来这种天生歌姬,微软小冰是半路出家,唱歌的原理也不一样——虚拟歌手需要录制好的声音库,再通过重新拼接声音库中的片段形成歌曲;而小冰唱歌是根据输入的信号做出发声的反应,也就是机器学习。
如今的小冰已经更新到了第四代,在音调、音质、自然度、衔接上都有了极大的改进,此外又加上了换气的声音和人类的演唱技巧,大大提高了演唱的自然度。
佐藤莎莎拉
佐藤莎莎拉是由基于HMM合成技术的声音创作软件CeVIO Creative Studio创造的虚拟歌姬,因其酷似真人的声音,被粉丝称为站立在现实和动画的交界处的女主角。
CeVIO Creative Studio采用的算法在本质上与VOCALOID的"拼接算法"不同,HMM合成通过提取人声中的特征量建模,可以最大程度保留人声的特征,经过后期可以与VOCALOID媲美甚至更加接近人声,在声音的拟真度上可以说也并不逊于今天的小冰。
在某种意义上,虚拟歌姬和小冰都是利用技术降低了艺术创作的门槛,但根本性的不同在于对这一问题的回答:
科技在艺术创作中应该扮演什么样的角色?
显而易见的是,小冰所代表的无疑是一个激进的科技派:利用科技的发展降低、乃至消除艺术创作的门槛,让技术引导人类的进步。
而Vocaloid方面,尽管YAMAHA公司也一直在不断探索前沿的语音合成技术,在音乐创作上采取的却是最为传统的姿态:提供一个乐器,但将创作的自由完全归还给创作者。
这种态度最大程度上回归了艺术的本源:人的自我表达,但另一方面,也在客观上保留了创作的门槛。在Vocaloid的圈子里,真正创造价值的仍然是创作者本身,在这里,技术让位于了人类。
当然,以小冰的人工智能水平,我们并不需要讨论“人工智能威胁论”之类的东西,但现实的问题确实摆在眼前:在艺术创作领域,“大众”、“简便”的工业化生产似乎已经近在咫尺,而这种流水线生产真的就能完全取代专业而精密的调教了吗?对于创作者而言,“艺术创作”究竟是怎样一种行为,而对于观众们来说,他们欣赏艺术作品时,希望接收到的又是什么呢?
其实艺术创作所赋予观众乃至社会的,并不是简单地文字优美、曲调生动,而应该是一种来自于现实社会的思想。