AI 互联网就要到来:BAT、微软、联想们危险了
近来因为创业同陈孝良博士(声智科技创始人,声学、语音识别专家)对未来进行了较多探讨,非常认同陈博士对未来趋势的两个关键判断:
1. 移动互联网之后 AI (人工智能,英语 Artificial Intelligence)互联网正在到来,但这是一个慢热的过程。
2. 2~3年内 AI 领域会出现回调(类似2000年的互联网)。
用常用语来描述那就是前途是光明的,但道路是曲折的。这篇文章主要就想探讨下曲折的道路上会有什么,道路的终点又会有什么。
AI互联网时代
现在我们的生活里处处都是移动互联网的痕迹:今日头条、微博、微信、起点读书、京东、美团外卖、滴滴打车时刻围绕在我们周围。手机已经成为一种外延器官,人们的生活围绕着手机展开。
AI 互联网则会被进一步重构每个人生活的模式,想象一下:
早晨 Echo 这样的智能助理会把我们从睡梦中叫醒,当我们还赖在床上的时候,它会根据我们的偏好组合出一组有趣的新闻。起床后,智能助理帮预定的早餐已经送到,又因为这一天是在家办公,所以可以比较悠闲的吃个早饭。之后则会带上一幅 AR 眼镜开始自己一天的工作,当需要和同事沟通时那个同事会被迅速投影到自己的身边,共享相同的视角进行问题讨论。工作一段时间后智能助理会提醒你需要进行活动,并根据日常的习惯推荐了今天的午餐,你从推荐中选了一个,然后继续一天的工作。晚上需要外出时一辆无人驾驶的车会根据此前的预约开到指定地点来接你。晚上回家后,智能助理提示说你关注的老家的房价又有变化可以入手了,这时又需要带上 AR 眼镜,身临其境的感受目标房子的状况。远程办公因为 AI 互联网而越来越方便,所以你可能会考虑告别高房价的大都市,回到自己的家乡了……
AI 互联网下智能助理无处不在,自动化无处不在,增强现实无处不在,这与移动互联网不同。
此前人们尝试用IoT(万物互联)来描述下个时代,想象出的图是下面这样:
---By Gartner
但万物互联这表述并没抓住变化的关键点,同连接、乃至数据的产生方式相比,更重要的显然是数据的消费方式(场景和人机交互方式)和处理方式(比如云)。
2016年这个时间点之所以激动人心是因为从智能助理到 AR 眼镜再到自动驾驶每一点都露出了一点点曙光,所以人们才对 AI 倾注了如此多的热情,但所谓的泡沫大多时候根本不来自于事情本身的不合理和没想象空间,而是来自于尺度上的误判。要想把握这种尺度,那么要回到新浪潮根本的技术驱动力。
AI 互联网的核心驱动力
各方面的技术进展确实都在暗示我们 AI 互联网会来。
AI 互联网的核心基石之一是传感器。
显然只有及时充分感知到环境的变化智能助理才能变得真正智能。也只有真正感知环境才能有真的自动化。假设我们对智能助理说:请帮我放首歌吧。这个时候如果什么数据都没有,那智能助理唯一能做的事情是随机选一首,最终结果就是你可能喜欢刘德华但出来的是鹿晗。这不是智能不智能的问题,你让一个陌生人在打电话的时候给你推荐首歌一样是这结果。
这时候为了让智能助理真的智能,那需要让它有眼睛、耳朵和记忆。假设说它有了记忆,那从你的历史数据中就会发现你是个中年大叔,听歌也比较怀旧,那就不会推鹿晗给你了,但如果没有眼睛和耳朵那它还是可能在你想放浪漫一点的歌时来首哀伤的破坏气氛,为了解决这问题就需要利用到眼睛(比如摄像头)和耳朵(比如麦克风阵列)拥有感知环境的能力,通过它们智能助理就可以识别出你是一个人躺在床上还是在和女朋友一起,是在咖啡厅还是一个人在大街上。
传感器的精度和种类确实在增加(参见下图),尺寸也确实在缩小,电池的发展一般给力,但问题是前端计算能力不足,同时数据是割裂的,一个人的不同维度的数据是在不同的公司手中。
AI 互联网的第二个基石是带宽和延时。
在所有变量里这点反倒是最确定的,不管是 5G 还是 WiGig (Wireless Gigabit,无线千兆比特,是一种更快的短距离无线技术)都在稳定推进。人们对 5G 的预期是延时降到 5 倍,带宽提升 10 倍到100 倍。但 5G 的落地牵涉运营商,所以落地会相对较慢,现在预测 2019 年才会有第一个 5G 网络出现。作为短距离无线的 WiGig 则走在了前面,率先公布了 802.11ad 标准,这会把 WiFi 的传输速率提升到 1GB 。高速率低延时的网络为 VR/AR 等的展开铺平了道路。
在带宽和延时上唯一的障碍就是时间,指望 5G 在 3 年内摊开显然是不现实的。
AI 互联网的第三个基石是深度学习、数据和计算能力。
其中计算能力的增长借助 GPU (Graphics Processing Unit,图形处理器)增速最为迅猛,也最为确定,3年间训练速度增加60倍,Inference 速度增加约16倍。数据的获取则会受制于传感器的部署,但算法的进一步突破则具有高度的不确定性,科学家们很可能在十年间也搞不定 NLU (自然语言理解,Natural Language Understanding)和无监督学习,这是让AI互联网迟到的最大风险。
商业信号则从另一个侧面佐证了很多大公司也作出了同样的判断。
最近与此相关的三场收购是高通收购 NXP,三星收购哈曼,ADI 收购固态激光波束转向技术 Vescent Photonics。这些公司如果不是对未来的做出了某种预判这些收购就不会发生。
其中高通的收购最具代表性,下图是对这次收购的核心概括:
看了你就会发现对这次历史上最大半导体收购的唯一合理解释就是 AI 互联网会来,并且这种变革首先从车开始。而其它的两次并购在这逻辑下也同样成立。
谁是AI互联网时代的主导者
谁主导AI互联网谁就是下一个BAT。
但这地方有一个极为关键的点被惯性思维掩盖了,那就是未来并不会有 Windows 也不会有Android,而只会有软硬一体的产品。所以未来的BAT很可能从硬件产品厂商中首先诞生。
我们假想一下这样一种情况,Oculus Rift、索尼和 HTC Vive 最终成为极为流行的 VR 设备并占据60% 的市场,剩余的市场份额被其它小厂商瓜分。那么这时候这三家厂商那家会愿意把操作系统让出来或者把应用商店让出来,成就一个微软或者 Android 而自己变为纯粹的设备制造商吗?没有一家会这么做,这相当于自己春天辛苦种地,但秋天的时候则把收成免费让给别人。每一家都会用尽一切办法确保自己能够主导生态,拿到最大利润。引申一步那就是不会再有微软、不会再有 Android 、不会再有联想和 Dell,有的只是一个个或大或小的苹果。
历史的惯性给了很多人一种错觉,总是觉得过去的模式会被重复,但实际上过去的商业现实已经深刻的教育了所有参与者,没人想成为单纯的做壳,做销售的公司。硬件产品开发者已经认识到做产品的核心不是销售数量而是把握品牌和生态,没粘性的销售数量只有短期价值。
这导致很多现有互联网公司的硬件产品打法驴唇不对马嘴。互联网时代核心的盈利模式是广告和游戏,特征则是前端不赚钱后端变现。这导致互联网公司对赚取前端利润不感兴趣。 比较下述两种打法:
一种是从高往低打,在新品类的初期不追求低价和销量,而是打磨产品追求美誉度,理想结果就是品牌即品类。
一种是从低往高打,在新品类的初期就做便宜的产品,期望能够累积数量,形成有价值的入口。互联网公司的后端变现思路导致他们做硬件的时候会选择这方式,因为低价数量会多,所有市场数据也确实证明低价数量会多。
但在做有科技含量的新品类的时从低往高打其实会完败。我们拿这种思路和 Rokid(从高往低打的代表)进行比较就可以把事情看的更清楚。
从低往高打做出的便宜智能音箱确实可能多卖一些,比如30万台。从高往低打的 Rokid 显然会卖得少比如几千台或者几万台。但这个时候市场并没有启动,所以即使多也不存在迅速占据市场的可能。再往下便宜的产品由于产品体验限制(你不可能在新品类上做出即便宜又体验好的东西)会被用户迅速抛弃,人们不再记得还有这么一款产品。Rokid 虽然也没卖几台,但 Rokid 已经累计了它的品牌价值,甚至已经代表了这个品类,如果智能音箱真的起量,它就可以迅速推出中档的产品占据市场份额。
我们仍然很难猜测谁是 AI 互联网时代的成功者,但如果上面说的两点(成功的产品玩家会控制生态而不是把操作系统、应用商店等开放出来,互联网公司秉持硬件低价抢入口的思路不可能改变)同时成立,那曾经成功的思维模式正在成为下一步的障碍。
想象不用工作的日子
移动互联网的核心是便利和便宜,但 AI 互联网除此之外还可能带来的一个后果是工作时间缩短。
资本主义刚开始的时候,工人们每天要劳动 14 至 16 个小时,有的甚至长达 18 个小时,此后历经多次多种斗争最终 1866 年第一国际日内瓦会议提出八小时工作制的口号。1886 年 5 月 1 日,以美国芝加哥为中心,在美国举行了约 35 万人参加的大规模罢工和示威游行,示威者要求改善劳动条件,实行八小时工作制。我们熟悉的五一劳动节就是这么来的,此后 100 多年工作时间确实在缩短,包括法定假日和周末现在每个人大概一年有 1/3 的时间是在休假(创业的除外,比如我们...)。
那么AI对工作时间会有什么进一步的影响?
一个核心的影响预计是工作时间会进一步缩短,标准的工作时间很可能变成一周休息五天工作两天,因为很多工作会变的没有价值,而在缩短工作时间和大量失业之间明智的政治家更可能会选择前者。
小结
总结来看技术信号、商业信号都在提醒我们 AI 互联网正在到来,不同的公司不同的人会从不同的角度对此进行类似的解读,比如在乌镇联想杨元庆把它表述为 Smart Internet,nVidia也做过类似的表述,但有意思的是这类事情并不能用任何手段进行证明,有的只是信号,最终的判断也只依赖于信或者不信。