《必然》
作者序
我十三岁时,父亲带我去了新泽西州的大西洋城参观一个计算机展会。那是1965年。父亲对那些房间大小的机器感到超级兴奋。这些机器的制造者是诸如ibm之类美国最顶尖的公司。父亲信奉进步论,而那些最早期的计算机便是他想象中的未来一瞥。我当时就像个典型的青少年一样,对此非常不以为然。那些占满巨大展厅的计算机实在无聊。除了以英亩为单位计量大小的长方形铁柜之外,就没什么可看的了。展会中一块屏幕也没有。也没有语音输入和语音输出。这些计算机唯一能做的事情,就是在一排排的折叠纸上打印数字。我在科幻小说中读到了很多关于计算机的描写,而这些展会上的东西都不是“真正”的计算机。
1981年我在佐治亚大学的一个科学实验室里工作时,得到了一台appleii型计算机。尽管它有一台小小的黑绿两色显示器,可以显示文字,但我对这台计算机的印象也并不深刻。虽然打起字来比打字机好上不少,而且在绘制函数图像和追踪数据方面,这台电脑也是个“行家”,但它还不是一台“真正”的计算机。它并没有给我的生活带来什么改变。
几个月后当我把电话线插进appleii的调制解调器时,我的看法完全改变了。突然间一切都变得不一样——电话插孔的另一端是一个新兴的宇宙,它巨大无比,几乎无垠。那里有在线公告板和实验性的电话会议;这个空间被称作互联网。这根电话线中的传送门开启了一个新的东西:它巨大,同时又能为人类所感知。它让人感到有机而又非凡无比。它以一种个人的方式将人与机器连接起来。我能感觉到我的生活逐渐进入到了另一个层次。
回想起来,我认为在计算机与电话线连接之前,计算机时代并没有真正到来。相互孤立的计算机是远远不够的。直到二十世纪八十年代初,当计算机接入电话线并与之融合为强壮的混合系统,计算的深远后果才真正展开。
在那之后的三十年里,通信与计算之间的技术融合已经开始扩散、成长、开花、结果。互联网/web/移动系统已经从社会的边缘(1981年时人们对这类系统几乎毫不关心)进入到现代全球社会的舞台中心。在过去的三十年里,以这种科技为根基的社会经济经历了跌宕起伏,也见证了这个时代中英雄的兴衰更迭。但很明显,这三十年中所发生的一切都被一些大势所主导。
这些影响广泛的历史趋势至关重要,因为孕育它们的基础环境仍在活跃和发展。这也强烈地预示着,这些趋势将会在未来数十年中持续增长。我们还看不到任何阻止或削弱它们的力量。在本书中,我将会对十二种必然的科技力量加以阐述,而它们将会塑造未来的三十年。
“必然”是一个强烈的措辞。它会引起部分人的警觉——这些人相信,没有什么事情是必然的。他们认为,人类的主观意愿可以、也应当对任何机械的趋势加以扭转和控制。在他们看来,“必然”是我们对自由意志的放弃。而当必然的观点和科技结合在一起时,就像我在本书中所做的一样,对宿命的反对就会变得更加强烈和激昂。有一种对“必然”的定义借用了经典的“倒带”思想实验。这个实验假定我们把历史倒退回时间的开端,让我们的文明一次又一次地从头再来。强必然性是说,无论我们重复多少次,最终都会出现这样的结果:2016年的青少年们每五分钟就要发一条推文。但这不是我说的必然。
我所说的必然是另外一种形式。科技在本质上有所偏好,使得它朝往某种特定方向。在其他条件都相同的前提下,决定科技发展动态的物理原理和数学原理会青睐某些特定的行为。这些偏好仅存在于塑造科技大轮廓的合力中,并不会主宰那些具体而微的实例。譬如,因特网的形态——由网络组成的遍布全球的网络——是一种必然,但我们所采用的因特网的具体实现就不是必然。因特网可能是商业化的,而不是非营利的;它可能是国家的,而不是国际的;它也可能是私密的,而非公开的。长距离传输语音信息的电话系统是必然的,但iphone不是;四轮车辆是必然的,但suv不是;即时信息是必然的,但推特不是。
每五分钟发一条推文并非必然还有另外一层原因。我们处于飞速的变化中;我们发明新事物的速度已经超出了我们“教化”这些新事物的速度。今天,一项科技问世之后,我们需要大约十年的时间才能对其意义和用途建立起社会共识。就推特来说,我们还要五年的时间才能为其找到一个合适的栖身之所。正如我们会弄清楚如何处理无处不在的手机铃声一样(用振动模式!),到那时,今天的种种现象可能都已消失得无影无踪,我们就会认识到它既无必要,也非必然。
我在本书中所谈及的数字领域中的必然是一种动能,是正在进行中的科技变迁的动能。过去三十年里塑造数字科技的强劲浪潮还会在未来三十年中继续扩张、加强。这不仅适用于北美,也适用于整个世界。在这本书中我所列举的例证都发生在北美,因为读者会更熟悉它们。但每一个例证,我都可以轻易地找出其在印度、马里、秘鲁或爱沙尼亚的对应事例。例如,数字货币的真正领先者是在非洲和阿富汗——在这些地方,电子货币有时是唯一可用的货币。而在开发移动端分享应用方面,中国已经遥遥领先。尽管表象会受到文化的影响,但其潜在的内因都是一样的。
在过去三十年的网上生活中,我起初是这篇广袤荒野的拓荒者,之后又成为建设这片新大陆的建造者中的一员。我对必然的自信建立在科技发展的深层根基之上。日新月异的高科技板块下是缓慢的流层。数字世界的根基被锚定在物理规律和比特、信息与网络的特性之中。无论是什么地域,无论是什么公司,无论是哪种政体,这些比特和网络的基本成分都会一次又一次地孕育出相似的结果。在本书中,我会尽力揭示出这些科技的根基,因为它们会展示出未来三十年中的持久趋势。
这些转变并不全都受欢迎。由于旧的商业模式失灵,既有的行业将被推翻。行业中的所有职业将会消失,一同消失的还会有一些人的生计。新的职业将会诞生,而这些职业会滋生不公和不满。我在本书中阐述的这些趋势将会挑战现行的司法假设,碰触到法律的边界。数字网络技术动摇了国际边界,因为它本身就是无国界的。它会造成冲突和混乱。
当我们面对数字领域中极力向前的新科技时,第一反应可能是退回原位。我们会对它加以阻止、禁止、否认,或者至少会让它变得难用无比。(举个例子,当因特网让音乐和电影的复制变得轻而易举时,好莱坞和音乐产业就开始尽其所能来阻止人们复制。但这全然徒劳。他们只是成功地把顾客变成了敌人。)螳臂挡车只会适得其反。任何禁止的做法最多只能暂时有效,从长远来讲则违背了生产力的发展。
睁大眼睛,以一种警醒的态度来拥抱新科技则要有效得多。我在本书中的意图是揭示数字变化的根基所在。一旦洞察,我们就不用采取对立的态度,而是可以因势利导。我们会更深入地理解,为何大规模复制、大规模跟踪以及全面监控会在这里大行其道。我们也会认识到,基于所有制的商业模式正在发生改变;虚拟现实正在成为现实;我们也无法阻止人工智能和机器人改进和创造新的商业,从而抢走我们现有的工作。这或许和我们最初的动机相悖,但我们应当拥抱这些科技的再造和重组。只有与这些科技协作而非阻挠,我们才能最大程度地获取到科技所要给予我们的。我并不是说要放手不管。我们需要对新兴的发明加以监管——无论是从法律层面还是从技术层面,以避免真正(而非假想)的伤害。我们需要依据这些科技的特性来“教化”、“驯服”它们。但我们必须要深度参与,亲身体验,谨慎接受。唯有如此,这些科技才不会弃我们而去。
变化是必然的。我们现在承认,一切都是可变的,一切都在变化当中——尽管很多变化并不为人所察觉。我们说水滴石穿,而这颗星球上所有的动植物也在以一种超级慢动作演变成为不同的物种。即便是永远闪耀的太阳,也会在天文学的时间表上逐渐褪色,只不过当它发生时,我们早已不复存在。人类的文化和生物学现象也如同一部极其缓慢的幻灯片,在向着某个新的形态移动。
而在今天,我们生活中每一项显著变化的核心都是某种科技。科技是人类的催化剂。因为科技,我们制造的所有东西都处在“形成”的过程中。每样东西都在成为别的东西,从“可能”中催生出“当前”。万物不息,万物不止,万物未竟。这场永无止境的变迁是现代社会的枢轴。
不断变化不仅仅意味着“事物会变得不一样”,它也意味着流程——变化之引擎——比产品更重要。在过去二百年里,我们最伟大的发明恰恰是科学流程其自身,而非某个特定的工具或玩意儿。一旦我们发明了科学方法,就能立即创造出数以千计的神奇事物,而这是用其他方法所做不到的。这种能够产生持续改变和改进的方法性的流程要比发明任何产品都强上百万倍,因为自这种流程发明以来,我们已经借助它生成了数以百万计的新产品。正确掌握这种流程,它就能源源不断地带给我们好处。在我们所处的新时代,流程完胜产品。
永无休止的变化是一切人造之物的命运。我们正在从一个静态的名词世界前往一个流动的动词世界。在未来的三十年里,我们还会继续使用汽车、鞋子这样有形的物体,并会把它们转化成为无形的“动词”。产品将会变成服务和流程。随着高科技的注入,汽车会变成一种运输服务,一个不断更新的材料序列,对用户的使用、反馈、竞争、创新乃至穿戴做出快速的适应。无论这辆车是无人驾驶汽车,还是可以由你驾驶的私家车,这种运输服务生来具有灵活性,它可定制,可升级,可联网,而且可以带来新的便利。鞋子同样不再会是成品,而会成为塑造我们双脚的无尽流程。即便是一次性的鞋子,都会成为服务,不再会是产品。而在无形的数字领域中,没有任何静态的东西,也没有一成不变的事物。所有一切,都在成为其他。
这无情的变迁之上是现代的分崩离析。我见证过无数科技力量的爆发,并从中归纳出了十二个动词。更准确地说,它们不仅仅是动词,还是一种”现在分词”,用来表达“持续动作”的一种语法形式。而这些力量正是处在加速中的动作。
这十二个持续动作中,每一个都是一种正在发生的趋势。所有迹象表明,这些趋势将持续至少三十年。我把这些元趋势称为“必然”,因为它们植根于科技的本质,而非社会的本质。这些动词的特性来源于所有新科技所共有的偏好。虽然作为创造者我们对科技的取向有很多选择和责任,但仍有许多因素是我们无法控制的。特定的技术流程会倾向于特定的产出。比如说工业流程(蒸汽机、化工厂、水坝)会倾向于人体所不适应的高温和高压;而数字科技(计算机、互联网、移动应用)则倾向于大规模廉价复制。工业流程对高温/高压的偏好促使制造的场所离人们越来越远,并向大规模、中心化的工厂演变,这种演变与人类社会的文化、背景和政治因素无关。而数字科技对大规模廉价复制的偏好也同样独立于国家、经济和人类意愿,并使科技转向了大规模社交;这种偏好的背后是数字比特的内在特性。在上述这两个例子中,我们都只有“倾听”科技所偏好的方向,并使我们的期待、管理和产品服从于这些科技所内在的基本趋势,才能从科技中获得最大利益。当我们对科技的利用贴近于科技所偏好的轨迹时,我们才会在管理复杂性、优化利益和减少科技带来的伤害方面更加得心应手。本书的目的便是将这些科技中的最新趋势整理归纳,并将它们的轨迹呈现出来。
这些有机的动词代表着在未来一段时间内都会呈现在我们文化中的一系列元变化。这些元变化已经在当今世界留下了浓墨重彩的描画。我无意预测哪种特定的产品会在来年或者未来十年中走红,也无意预言哪些公司将会胜出。这类结果取决于潮流、时尚和商业等因素,是完全不可预测的。但未来三十年中产品和服务的总趋势则已清晰可见。新兴技术正在席卷全球,这股迅猛的大潮会潜移默化且持续坚定地改变我们的文化。下述力量将会得到凸显:形成(bing)、知化(cognifying)、流动(flowing)、屏读(screening)、使用(essing)、共享(sharing)、过滤(filtering)、重混(remixing)、互动(interacting)、追踪(tracking)、提问(questioning)以及开始(beginning)。
虽然我对每个动词的论述都独立成章,但这些动词并非独自运作。相反,它们是高度叠加的力量,彼此依存,相互促进。很难只论其一,不及其他。分享既促进流动又有赖于流动;认知需要追踪;屏读和互动不可分离;这些动词本身就在融合,又都处于成为的过程中。它们构成了一个运动的域。
这些力量并非命运,而是轨迹。它们提供的并不是我们将去往何方的预测。它们只是告诉我们,在不远的将来,我们会向哪些方向前行,必然而然。
第1章 形成 becoming
我已经60岁了,但我最近才有所顿悟:世间万物都需要额外的能量和秩序来维持自身,无一例外。我知道一般来说,这就是著名的热力学第二定律,即所有事物都在缓慢地分崩离析。但最近几年中,事物分崩离析的速度是我不曾体验过的。现在,我能感受到所有事物都处在不稳定的状态中,并且还在飞速地消耗。这种现象不仅发生在高度组织化的生物当中,还发生在石头、钢铁、铜管、碎石路和纸张这些最死气沉沉的东西上。没了照料和维护,以及附加其上的额外秩序,万物无一会长存下去。生命的本质,似乎主要是维持。
最近让我惊讶的,是新科技所需要的维护量。维护一个网站或者一套软件运转,就如同保持一艘游艇漂浮在水面上一样,都是吸引注意力的黑洞。我多少能够理解,为何像水泵这样的机械会在一段时间的试用后坏掉:水分会锈蚀金属,空气会氧化防水膜,润滑油会蒸发消失——所有这一切都需要修复。但我并没想到过,由比特组成的无形世界也会分解。那么,有什么是不会坏掉的呢?很显然没有。
全新的电脑也会有僵慢卡死的那天。芯片会老化。程序会出故障。刚刚发布的新软件立刻就会开始出现损耗。而这一切,都是自然而然发生的,和你没有任何关系。我们的工具越复杂,就越需要(而不是越不需要)我们的照料。事物对变化的自然倾向无可避免,即便是我们熟知的事物中最具吸引力的那个——比特。
然后,不断变化的数字领域就扑面而来。当你身边的所有东西都在升级的时候,你的数码产品自然也会受到压力,让你对它们进行必要的维护。即使你不太想升级,也必须这么做,因为所有的东西都是如此。这是一场升级军备竞赛。
在升级工具这件事上,我曾经是个吝啬鬼(毕竟眼前的工具还能用,为什么要升级它?),不到最后一刻绝不换新的。你知道这是怎么回事:升级了这个东西之后,你忽然需要升级那件东西,紧接着又得因此把所有的东西全升级一遍。我有过一次对小零件进行“小”升级而毁掉了全部工作生活的经历,所以我才会把工具更新这件事推延好几年后才做。但是,我们的个人科技产品正变得更加复杂,变得对外围设备更加依赖,变得更像有生命的生态系统,推迟升级的行为也就随之变得更加具有干扰性。如果你拒绝进行不断的小升级,那么积累起来的变化会最终变成一项巨大的更新,大到足以带来“创伤”级别的干扰。所以,我现在把升级看作是一种卫生措施:只有定期升级,才能让你的科技产品保持健康。持续不断的升级对科技系统来说至关重要,重要到这已经成为主流个人电脑操作系统和部分软件应用中的自动功能。而在这背后,机器也将会更新自己,随时间慢慢改变自己的功能。这一切循序渐进,所以我们不会注意到它们正在“形成”。
我们把这场进化当作了平常现象。
未来的科技生命将会是一系列无尽的升级,而迭代的速率正在加速。功能不再一成不变,默认设置荡然无存,菜单变成了另外的模样。我会为了某些特殊需要打开一个我并不会每天都使用的软件包,然后发现所有的菜单都消失了。
无论你使用一样工具的时间有多长,无尽的升级都会把你变成一个菜鸟——也就是说,你会变成笨手笨脚的新用户。在这个“形成”的时代里,所有人都会成为菜鸟。更糟糕的是,我们永远都会是菜鸟,并永远因此保持虚心。
这意味着重复。在未来,我们所有人都会一次又一次地成为全力避免掉队的菜鸟,永无休止,无一例外。原因在于:首先,未来30年中,大部分可以主导生活的重要科技还没有被发明出来,因此面对这些科技,你自然会成为一个菜鸟;其次,因为新科技需要无穷无尽的升级,你会一直保持菜鸟的状态;第三,因为淘汰的循环正在加速(一个手机应用的平均寿命还不到30天!) [1] ,在新科技被淘汰前,你不会有足够的时间来掌握任何事情,所以你会一直保持菜鸟的身份。永远是菜鸟是所有人的新设定,这与你的年龄,与你的经验,都没有关系。
如果我们诚实的话,就必须承认,技术元素之所以不停升级和持续变化,有一方面就是为了让我们魂不守舍。就在不久前的某一天,我们(所有人)都觉得没有手机的话,第二天就活不了了。但在10年以前,这种需求却会让我们目瞪口呆。现在,网速一慢,我们的脾气就见长,但在以前,在我们还很“纯真”的年代里,我们对网络一点想法也没有。今天,我们渴望无时无刻地和朋友保持联系,但在从前,我们只是每周,最多每天才和朋友联系一次。但新事物还是源源不断地被我们发明出来,它们给我们带来了新的欲望,新的向往,新的需求,也在我们的思绪里挖出了难以填满的新的沟壑。
有人感到愤怒,不满我们被所造之物如此摆布。他们把这种没有穷尽的升级和变化看作是一种堕落,认为这是对人类高贵尊严的践踏,也是我们不愉快的根源。我同意,科技确实是根源。科技的动向推动我们永远追求“新”,但“新”总是转瞬即逝,在永不停歇的变化中被更新的事物所取代。满足感因此不断从我们的指尖溜走。
但我还是庆幸。庆幸科技元素带来了永无止境的不愉快。我们与动物祖先的区别,在于我们不仅满足于生存,还要疯忙着去创造出前所未有的新欲望。正是这种不满足触发我们创造,推动我们成长。
不在心中制造待以填补的缺憾,我们就无法拓展自己,更无法拓展我们的社会。我们正在拓宽我们的边界,也在拓展存放自我身份的容器。这过程会痛苦不堪,其中定然会有泪水和伤痛。深夜播出的专题广告片和无穷无尽的已被淘汰的科技产品自然难以提升科技,但我们扩展自身的道路本就是平淡乏味,日复一日。因此,当我们展望更美好的未来时,这种种相对的不适也应该考虑在内。
没有不适的世界会停滞不前;某些方面过于公平的世界,也会在其他方面上不公平得可怕。乌托邦中没有问题可烦恼,但乌托邦也因此没有机遇存在。
因为这种悖论,乌托邦永远都不会奏效,我们也因此不会为这个问题担忧。每一种乌托邦的构想,其中都存在使其自我崩溃的严重瑕疵。我对乌托邦的厌恶更深。因为我从未见到让我想在其中生活的乌托邦,总是会感到无聊。而乌托邦的黑暗对立面——反乌托邦,却更加有趣,也更容易想象。毕竟,有谁构想不出一个大灾变中,世界上只剩下了一个人的世界呢?或者这个世界的统治者是机器人领主?抑或是逐渐沦为贫民窟的超级城市行星?甚至最简单的:一场毁天灭地的核大战?这些构想,都是现代文明如何崩溃的无穷可能性。但反乌托邦是不可能仅仅因为具有画面性和戏剧性,并且更加容易想象,就有可能成为现实的。
大部分反乌托邦故事里的瑕疵是其不可持续。消灭文明尤其困难。灾难越剧烈,反乌托邦就消失得越迅速。虽然灾难引发混乱,但应对系统会很快地自组织起来进行应对。我这里只举一个例子:不法分子和黑社会组织似乎会在“大爆发”时横行一时,但他们很快就会被有组织的犯罪和武装所取代。因此,不法分子会迅速变成敲诈犯,而敲诈犯变成腐败政府的速度或许还会更快,因为这一切都能让强盗们的收入最大化。从某种意义上讲,贪婪就可以解决无政府的问题。
真正的反乌托邦和电影《疯狂麦克斯》(mad max)毫无相似之处,倒更像是旧时的苏联:那里不会无法无天,反而充斥着令人窒息的官僚机构;社会被恐惧所统治,除了得到很少的一点利益之外,大多束缚不前。但就像两个世纪以前的海盗们一样,反乌托邦比外表看上去的更加守法,更有秩序。实际上,在一个真正破败的社会当中,和反乌托邦联系起来的残暴犯罪是严加禁止的。大强盗会让小强盗的数量和混乱程度保持在最低限度。
不过,反乌托邦和乌托邦都不是我们的归宿;我们的归宿会是“进托邦”(protobia)。更准确地说,我们已经到达了进托邦。
进托邦并不是目的,而是一种变化的状态,是一种进程。在进托邦的模式里,事物今天比昨天更好,虽然变好的程度可能只是那么一点点。它是一种渐进式的改进,也是一种温柔的进步。进托邦中的“进”(pro-)来自于“进程”(process)和“进步”(progress)。这种微小的进步既不引人瞩目,也不鼓舞人心,极易被我们忽略,因为进托邦在产生新利益的同时,也在制造几乎同样多的新麻烦。今天的问题来自昨天的成功。而对今天问题的技术解决方案,又会给明天埋下隐患。随着时间流逝,真正的利益便在这种问题与解决方案同时进行的循环扩张背后逐渐积累起来。自启蒙时代 [2] 和科学发明时代以来,我们每一年的创造,都比我们每一年的破坏多出那么一丁点。而这少少的积极变化,积累数十年才能进入我们所谓的文明之中。它带来的利益永远不会成为电影中的桥段。
进托邦很难被人察觉的原因,在于它是一种“形成”。它是一种变化方式不断变化的进程。进托邦本身就在变化成别的东西。虽然要我们为一种形态正在转变的软进程(soft process)喝彩不太容易,但察觉到它还是非常重要的。
今天,我们对创新的负面已经变得非常敏感,而且对过去种种乌托邦的承诺深感失望,以至于我们变得很难去相信一种进托邦的未来,哪怕它非常温柔,只是一种明天将会比今天前进一点点的未来。想象任何一种我们渴求的未来都会非常困难。不信?那么从科幻作品中为这个星球找到一种既有趣又让人满意的未来(《星际迷航》 [3] 不算,因为它发生在太空里)试试?
能幸福地驾驶飞行汽车的未来不再吸引我们了。和上个世纪不同,今天已没人想要搬进遥远的未来里生活。很多人甚至对其心生恐惧。这让人很难对未来严肃起来。所以我们被束缚在短视的现在,被困在视野不超过下一代人的当前。有些人接受了奇点理论 [4] 信奉者们的展望,即从技术上讲,想象未来100年是不可能的。我们因此对未来盲目。这种盲目或许只是现代社会难以逃避的苦恼。或许在文明和科技进步的这个阶段,我们进入到了一种永恒而无止境的现在,不会有过去和将来。乌托邦、反乌托邦和进托邦统统消失,只有盲目的现在(blind now)。
另一种选择是拥抱未来和未来的“形成”。我们所瞄准的未来,是当下就能看到的、“形成”这种进程的产物。我们可以拥抱眼下这些将会成为未来的变化。
恒常的“形成”所带来的问题(特别是在进托邦的龟速前行当中)是,不断地变化会让我们无视其渐进式的变化。在不断的动作当中,我们不会再去注意动作。变化因此是一种能自我掩盖的动作,常常会在我们回顾过去时才显现出来。更重要的是,我们倾向于从旧事物的框架中来观察新事物。我们当下对未来的展望,实际上会曲解新的事物,好让它适应我们已知的事物。这就是为什么最早拍摄出来的电影,都像是戏剧表演一样,而最早的虚拟现实(vr) [5] 又制作得好像电影一样。这种生拉硬套并不总是坏事。小说家在人类的这种反射中勘探发掘,从而将新事物和旧事物联系起来。但当我们尝试了解将来会发生什么的时候,这种习惯就会愚弄我们。我们很难感知到正在发生的变化。有时候,这些变化显露出的轨迹似乎不可思议、难以置信,甚至让人感到荒唐透顶,我们因此对其报以轻视。我们只会时常对那些已经发展了20年,甚至更长时间的事物感到惊讶。
我对这种干扰没有免疫力。我曾深度参与30年前在线世界的诞生,也迎接过网络的到来,还见证过这一文化变革迅速结出果实。然而在每个阶段,都很难在当时看到事物未来“形成”的模样。难以置信是家常便饭。有时候,我们察觉不到“形成”的方向,是因为我们并不认同这个方向。
我不认为我们需要无视这种持续进行的进程。最近一段时间,变化的速度已经是前所未有,这让我们放松了警惕。但现在我们知道,我们是,也将会是永远的菜鸟。我们会更经常地相信那些不太可能的事情。所有事物都在流动,而新的形式将会是旧事物的融合,这种融合与旧有的那些远远不同。通过努力和想象,我们可以学习更加清晰地辨识前方,不再盲目。我写下本书,很大程度上是为了将我们目前变化的状态梳理清楚,并使过去30年中一直向着进托邦缓慢前行的漫长趋势之轨迹显现出来。
让我举个例子,来说明我们通过最近几年网络的历史,可以学习到哪些关于未来的东西。1994年,在网景scape) [6] 这个图形浏览器点亮网络之前,互联网只有文字,而且对大多数人来说并不存在。它很难使用,没有图形画面,你要输入代码才能够使用它。谁愿意把时间浪费在这么无聊的东西上?如果当时的人们知道互联网的存在,那么无论是企业邮件(和领带一样让人兴奋)还是为青少年开办的俱乐部,都会轻视互联网。尽管它确实存在,互联网还是被人们完全忽略掉了。
任何大有作为的新发明都会有反对者,而且作为越大,反对声也越大。在互联网诞生的黎明阶段,我们不难找到聪明人对互联网说的糊涂话。1994年晚些时候,《时代周刊》如此解释为什么互联网永远不会成为主流:“它并非为商业设计,也不能优雅地容忍新用户。”瞧瞧!1995年2月,《新闻周刊》 [7] 在标题里怀疑得更直接:“互联网?呸!”(inte?bah!)这篇文章的作者是天体物理学家、网络专家克里夫·斯托尔 [8] 。他认为在线购物和网络社区有违常识,都是不切实际的幻想。他在文章里说:“真相是,在线数据库不会取代报纸。然而麻省理工学院媒体实验室(mit mediab)主任尼古拉斯·尼葛洛庞帝 [9] 却预测说我们会直接从互联网上购买书籍和报纸。啊,说得多好。”当时,对充满“互动图书馆、虚拟社区和电子商务”的数字世界抱有怀疑是主流的看法,斯托尔用两个字给这种看法下了个结论:“胡扯。”
1989年,在我和美国广播公司(abc)高层参加的一场会议里,就弥漫着这种轻蔑的气氛。当时我向这群坐办公室的人们展示“互联网这个东西”。他们的情况是,abc的高管意识到了有事情发生。当时的abc是世界三大电视台之一,相比之下,那时的互联网就像蚊子一样渺小。但是(像我这样)生活在互联网里的人们一直在说,互联网会毁掉他们的生意。然而无论我告诉他们什么,都没办法说服他们互联网不是边缘事物、不仅仅是打字,而且最重要的是,不仅仅是十几岁的小男孩才用的东西。网络上那些分享行为,那些免费的东西似乎太过不可能。abc的一位高级副总裁,名叫史蒂芬·怀斯怀瑟(stephen weiswasser),把对互联网的贬低定了调。他对我说:“互联网会变成90年代的民用电台。”他后来又对媒体复述了一遍这个论调。怀斯怀瑟对于abc忽视新媒介的观点的总结是:“被动的消费者是不会变成互联网上的‘喷子’ [10] 的。”
我被请出了门。但我在离开之前,给他们提了一个建议。我说:“听着,我刚好知道abc这个地址还没被注册。快去你们的地下室,找到你们最懂技术的计算机极客,让他立刻把abc注册下来。别犹豫,这事值得去做。”他们茫然地向我表示了感谢。一周之后,我又检查了一遍,那个域名还是处在未注册状态。
嘲笑电视领域里的这些梦游者不难,但在为沙发马铃薯 [11] 想象替代方案这件事上,他们不是唯一碰到麻烦的。《连线》杂志也是这样。我是《连线》杂志的创始编辑,而在最近重新审视20世纪90年代早期的《连线》杂志(这些杂志都是我编辑过的,我曾经对它们引以为豪)时,我很惊讶地发现,这些杂志兜售的未来,充满了高产值的内容。这些内容包括:5000个永不关闭的电视频道和虚拟现实,以及来自美国国会图书馆的一堆比特。实际上,《连线》杂志对未来的展望,和abc这样的广播、出版、软件和电影行业所希望的一样。在这种未来里,网络基本上是以电视的方式运作。只需几次点击,你就能从5000个拥有相关内容的频道(而不是电视时代的5个频道)中选择浏览、学习和观看。从所有时段都在播放的体育比赛,到与海水水族相关的内容,你可以从这些频道中任选一个沉浸其中。唯一不确定的是,谁会给互联网填充内容?《连线》杂志的展望是,他们会是一群类似任天堂和雅虎这样的新媒体初创公司,而不是abc这样臃肿的旧媒体。
问题是,内容的生产代价昂贵,而5000个频道就会耗费5000倍的成本。没有哪个公司会富有到这种地步,也没有哪个行业能够庞大到这种地步,以成功运营这样的一个企业。本应为数字革命牵线搭桥的大型电信公司,为了应付网络投资而出现的不确定而陷于瘫痪。1994年6月,英国电信(british tel)的大卫·奎恩(david quinn)在一场软件发行商大会上承认:“我不知道你们怎么才能从这里面赚到钱。”向网络填充内容所需的金钱数额巨大,让很多科技评论家陷入惊慌。他们深忧网络空间(cyberspace)会变成网络郊区(cyburbia)——所有东西的从属和运营,都成为私有。
对商业化的恐惧在实际建造了网络之硬核(hardcore)的程序员群体中尤其强烈。这些硬核程序员是代码作者,是unix [12] 的拥护者,也是保持特殊网络运转的无私的it志愿者。这些脾气暴躁的网络管理员认为他们的工作高贵优雅,是天赋人类的恩赐。他们把互联网视作开放的公共场所,不能被贪婪和商业化侵蚀。虽然现在很难相信,但在1991年之前,在互联网上开商业公司被视作不能接受的运用方式,是被严格禁止的。那时的互联网没有电商,也没有广告。在美国国家科学基金会(national science foundation,当时负责管理主干互联网,以下简称nsf)的眼里,投资设立互联网的目的是研究,而非商业。当时的规定禁止将互联网“大范围用于私有事物和个人事物”,虽然这在今天看来天真至极,但在当时却颇得公共机构的欢心。在上世纪80年代中期,我参与了早期文本在线系统well的建造。我们的私有well网络接入新兴互联网之路颇为坎坷,部分原因是nsf的“可接受用途”政策对我们形成了障碍。最终,我们没被允许接入互联网,原因是well不能证明其用户不会在互联网上经营商业业务——当时的我们就已经对将要“形成”的东西视而不见了。
甚至在《连线》杂志的编辑部,这种反商业化的态度也弥漫开来。1994年,我们在为《连线》杂志的萌芽期网站“hotwired”举行早先的设计会议时,我们的程序员对我们酝酿的创新(最早期的点击横幅广告)非常失望,认为它破坏掉了这片新领域中前所未有的社交潜力。他们觉得网络很难建立在尿布广告的基础上,并且已经被人下令用榜单和广告破坏掉网络。但在互联网这个新兴的并行文明中,禁止金钱流通是疯狂之举。网络空间里存在金钱是必然的。
但和我们所有人都错失掉的大事相比,这不过是一个小小的错觉而已。
早在1945年,计算机先锋万尼瓦尔·布什 [13] 为网络的核心理念——超链接页面列出了大纲。但直到1965年,才开始有人尝试把这个概念变成现实。此人名叫泰德·尼尔森(ted nelson),是一名自由思想家。他展望了一个尼尔森版本的超链接计划。不过,在将数字比特应用到比较有用的事物上时,尼尔森则鲜有成就。因此他的努力仅被一群与世隔离的追随者所知晓。
1984年,我在一位计算机专家朋友的建议下,接触到了尼尔森,当时距离第一批网站的出现,还有十年的时间。我们在加州索萨利托(sausalito)一处阴暗的船坞碰面。他当时在附近租下了一间船库,看上去游手好闲:他的脖子上戴着一支挂在绳子上的圆珠笔,口袋里塞满了叠着的笔记,那些满满当当的笔记本里还露出了长长的纸条。他对我谈起他那整理人类全部知识的计划时,热切得让下午4点的酒吧都有些不合时宜。方案就写在那些尺寸被裁成3*5比例的卡片上,而这样的卡片,他还有许多。
尽管尼尔森彬彬有礼,和蔼可亲,但对于他的谈话,我的脑子还是有些赶不上趟。不过,我还是从他那关于超文本的奇特想法里收获到了不少惊喜。尼尔森确信,世界上所有的文档,都应当是其他文档的注脚,而计算机应该让这些文档间的联系变得清晰可见,永不间断。这在当时是一种全新的理念。但那还只是开始!他在检索卡片 [14] 上草草涂写出了他所说的“文档宇宙”(docuverse)中的好几种复杂概念。这些概念包括如何将著作权转回给创作者,以及当读者在存放文档的网络中挑挑拣拣的时候怎样追踪支付。“嵌入”(transclusion)和“互偶”(intertwingrity)这些术语,就是他在描述他设计的嵌入式结构会带来怎样的庞大犹如乌托邦似的好处时说出来的。而这种结构,将会把世界从愚昧中拯救出来!
我相信他。虽然尼尔森行事古怪,但我很清楚,一个充满了超链接的世界是未来某天将会实现的必然。在网络中生活了30年后,现在回想起来,我对网络之起源感到最吃惊的,是在万尼瓦尔·布什的预见、尼尔森的文档宇宙,尤其是我自己抱有的期望里,我们错失掉了多少东西。我们都错失了一件大事。关于超文本和人类知识相关的变革,只是网络变革的边缘。这场变革的核心,是一种全新的参与方式。这种参与方式已经发展成了一种建立在分享基础上的新兴文化。通过超链接所实现的“分享”方式,又创造出了一种全新的思想。这种思想一部分来自人类,一部分来自机器,前所未有,举世罕见。网络已经释放出了新的变化。
不仅是过去,我们没能想象出网络会变成什么样子,直到今天,我们仍然看不清网络变成了什么样子!我们把网络绽放出的奇迹当作理所当然。诞生20年后,网络已经广袤到难以测探。包括那些根据要求临时创建的页面在内,网页的总数量已经超过60万亿。平均到每个在世的人身上,就是接近一万个页面。而这些网页,全都是在过去不到8000天里创造出来的。
这种从一点一毫积攒出来的奇迹,会让我们对已取得的成就感到麻木。今天,通过任何一个互联网的窗口,我们都能得到各种各样的音乐和视频、全面透彻的百科全书,还能查看天气预报,帮助那些需要我们的广告,观看地球上每一个角落的卫星照片,跟踪全球最前沿的资讯。此外还有:纳税申报表、电视指南、导航路线、实时股票信息、电话号码、能虚拟体验的房地产交易信息、世间万物的照片、体育比赛比分、购买几乎任何东西的电商、重要报纸的存档,等等。而获取他们所耗费的时间,几乎为零。
这种视角如上帝般不可思议。仅需几下点击,你对世界上某一点的观察,就可以从地图转换成卫星照片,继而再转换成3d图像。想回顾过去?网上就有。你还可以聆听所有发微博、写博客的人每天的抱怨和说辞。我怀疑,天使观察人类的视角是否能够比这更好。
我们为什么不对这种满足感到惊讶呢?古代的国王们可能会为了获得这些能力发动战争。而从前,只有小孩子还会梦想着这样一扇充满魔力的窗户会成真。我曾经回顾过专家们对未来的期待,而我能肯定的是,没有任何人把这种物质全面丰富、按需取用而且完全免费的时代考虑进他们对未来20年的计划当中。在当时,任何蠢到把上述一切鼓吹成是不久后的未来的人,都会面临这样一套论据:全世界所有公司的投资加起来,所得到的钱也不够供养这样一个聚宝盆。网络今日取得的成就,在当时看来是不可能的。
但如果我们对过去30年有所了解的话,这种不可能就显得更加合理了。
泰德·尼尔森那关于超文本嵌入的复杂草图中,并没有想象到会有一个虚拟的跳蚤市场出现。尼尔森设想中的xanadu超文本系统,规模就好像那些自家经营的小咖啡馆一样,不用xanadu,你就写不了超文本文档。但恰恰相反,网络蓬勃发展出了ebay、craigslist [15] 、阿里巴巴这样的全球跳蚤市场,每年经手的交易量,就有数十亿美元。而这些跳蚤市场运作的地方,恰恰就在你的卧室里。令人惊讶的是,大部分工作是用户完成的:他们拍摄图片,分类信息,更新内容,宣传他们自己的产品,甚至管理他们的也是他们自己。虽然网站会联系当局逮捕恶意滋事的用户,但保证公平的主要方法,则是一个由用户产生评价的系统。30亿条反馈评论,就能创造出奇迹。
我们都没能看到,这个在线的美丽新世界,是怎样被用户制造出来的。脸谱网、youtube、instagram和推特所提供的全部内容,无一来自它们的员工,而是来自它们的受众。亚马逊的崛起令人咋舌,原因不是它变成了“万货商店”(这点不难想象),而是因为亚马逊的顾客(其中就包括你和我)争先写下的评论。这些评论使得用户在网站商品的长尾中选购变得可行。今天大部分重要软件的制作者,都不会去做问询台的工作。那些热情的顾客会在公司的产品支持论坛页面上向其他顾客提供建议和帮助,向新用户提供高质量客服服务。通过普通用户组成的巨大杠杆,谷歌公司得以将每月900亿次搜索所带来的流量和连接模式转变为新经济中有组织的智能。同样,没有任何人在对未来20年的预见中,看到这种自下而上的变革。
youtube和脸谱网上的视频无穷无尽,没有任何一种网络现象比这更能让人感到困惑。媒体专家们对受众的全部了解都加强了一种观念,即受众永远不会抬起屁股给自己找点乐子(他们了解的确实不少)。就像那个abc大佬说的那样,用户就是一群沙发上的马铃薯。所有人都觉得写作和阅读已死;所有人都觉得,当你能安坐下来聆听音乐的时候,创作音乐就太过麻烦了;所有人还觉得,业余者根本不会制作视频——用户产生的作品永远不会大规模实现;就算实现了,一个受众也吸引不来;就算吸引来了受众,也无关痛痒。那么,当你目睹在21世纪最初10年的开端里,5000万个博客几乎瞬间爆发出来、每秒钟都有两篇博客发布出来的场景之后,就会感慨这有多么震撼了。之后的几年,用户制作的视频又以每天65000条的速度上传到了youtube,2015年的每一分钟都会迸发出300个小时长度的视频 [16] 。而在最近几年,各种各样的警告、窍门和新闻标题又源源不断地爆发了出来。每个用户都在做着那些在abc、aol和《今日美国》(以及所有人)的希望中,只有abc、aol和《今日美国》才能做的事情。这些用户创造出的频道在经济方面毫无意义。制作它们的时间、能量和资源来自哪里呢?
答案是:来自受众。
参与行为所携带的营养推动普通大众在撰写免费百科全书、制作平光轮胎更换的免费教程,以及分类整理参议院投票这类事情上,投入大量精力和时间。这种模式在越来越多地支撑网络运转。几年前的一项研究发现,只有40%的网络内容是以商业形式创造出来的。支撑人们创造其余部分的,不是责任,就是激情。
这种朝着用户参与的突然转变,从那个认为规模化生产的商品优于任何手工产品的工业时代走出来,这种朝向用户参与的突然转变可谓一种惊喜:“我们曾经以为业余爱好者自己动手制作东西这种事,在那个马和马车的时代就早已消亡了。”对于制作东西和更加深入互动的热情,而不只是做出选择,是一种巨大的力量。虽然在数十年前,这种力量已经逐渐发展,但我们却未曾意料到,也未曾看到它。这种对于参与的原始冲动已经扭转了经济,并且还将在社交网络的氛围(众愚成智、蜂巢思维和协作行动)中稳步转换成社会的主流。
当一个公司像亚马逊、谷歌、ebay、脸谱网以及大部分大型平台那样,通过公共api将其部分数据库开放给用户和其他初创公司的时候,就已经开始在新的层面上鼓励用户参与了。运用这些能力的人们将不再是公司的顾客,而会为公司分担开发、销售、研发和市场工作。
用户和受众参与网络的方式不断进步,不断更新。这让网络把自己植入到了这颗星球上的每一项活动和每一寸土地中。实际上,在今天看来,人们对于使用网络会远离主流的焦虑看上去非常古怪。1990年,人们担心男性会在互联网上占据主导地位,但这担心完全多余。2002年,大家都错过了一个值得庆祝的时间点:当时,在线女性的人数第一次超过了男性。而在今天,网民中有51%是女性。当然还有一点,互联网不是,也从来不是青少年们的国度。2014年,互联网用户的平均年龄大约是44岁——这岁数的人腿脚已经开始不灵活了。
在全面接受网络这件事上,有什么例子会比阿米什人 [17] 也采用了互联网更有说服力呢?最近,我一直在访问几个阿米什农民。说他们老套并不过分:戴草帽、蓄胡须,妻子都还戴着19世纪风格的套头帽;他们不用电,不用电话,不看电视,外出则乘坐马车。阿米什人以抵触科技闻名,但这名不副实。实际上,他们只是很晚才采用了科技而已。当我听到他们提起自己的网站时,吃了一惊。
“阿米什网站?”我问道。
“给我们家生意做广告用的,我们的商店里会焊些烧烤架卖。”
“这样啊,可是……”
“哦,我们会在公共图书馆用网络终端,我们还会用雅虎。”
到此,我知道网络带来的转变已经完成,我们都在向着更新的方向变化。
畅想未来30年,网络会变得怎样激动人心时,我们不免首先想到网页2.0——就是更好的网页。但是2050年的网络不会是更好的网页,它会变成别的东西,和今天网络的差距就像是最初的网络和电视的差距一样。
严格来说,今天的网络从技术角度上可以被定义成我们通过搜索引擎搜索到的一切。也就是说,今天的网络就是所有可以访问到的超链接文件。但在今天,数字世界的大部分都不能用搜索引擎搜索到。脸谱网、手机应用、网络世界,甚至是一段视频里发生的很多事情,今天的搜索引擎都无能为力。但在未来的30年中不会是这样。超链接的触手会不断延伸,把所有的比特连接起来。一个主机游戏 [18] 里发生的事件会像新闻一样搜索即得。你还能寻找一段youtube视频里发生的事情。而只要说出你想从手机里找到姐姐收到录取通知书的那一刻,网络就会帮你搜索出来。
超链接还会延伸到实体当中,无论人造还是天然。把一块几乎免费的小芯片嵌入产品中,就能让你对你的房间,甚至整栋房子展开搜索。这种迹象已经出现。我可以用手机操作恒温器和音乐播放器。再过30多年,整个世界都会和我的设备交织在一起。毫无疑问,网络将会延伸到这颗星球的各个物理维度。
它还会延伸进时间。今天的网络显然忽视了过去。我或许能让你看到埃及塔希尔广场(tahir square)的实时流媒体影像,但想看到一年前的广场几乎不可能。浏览特定网站的早期版本特别不容易。但在未来30年中,就会出现能让我们查看过去任一版本的“时间机器”。就像你的手机可以加入过去几天、几个月乃至几年的交通数据来改善导航一样,2050年的网络也会充满了来自过去的内容。而网络本身也会延伸到未来中去。
从睡醒睁眼的那一刻起,网络就会尽力预测你的意图。在记录了你的日常生活后,网络会尝试先你一步:在你提问前就给出答案;在你开会前就给出文件;在你和朋友吃饭之前,就根据天气状况、地理位置、本周吃了哪些东西、上次和朋友见面吃的什么等等你会考虑的因素推荐出最完美的地点。
你还能和网络对话。你不用在手机上翻找朋友们的一堆照片,而只要向网络提起一个朋友,它就会预测出你希望看到哪些照片,还会根据你的反应,为你展示更多或者从另一个朋友那里拿来一些东西。又或者,你马上就要奔赴下一个会场,这时网络就能选出两份你必须要看的电子邮件。
网络会越来越像是一种存在,而非20世纪80年代大名鼎鼎的赛博空间那种你会前往的地点。它会像电一样,成为一种低水平的持续性存在。它无处不在,永远开启,暗藏不现。到2050年,我们会把网络理解成一种场景。
这种强化后的场景会释放出许多新的可能性。然而数字世界已经膨胀出了许多选项和可能。在未来几年里,网络似乎已经没有全新事物的落脚之处了。
你能想象在1985年,也就是互联网时代的黎明,当一个充满雄心壮志的创业者,是件多么棒的事么?那时,你可以得到任何你想要的域名,还不用承担任何成本。这么好的机遇持续了很多年。1994年,《连线》杂志的一个记者发现mcdonalds没被注册后,在我的鼓励下注册了下来。之后,他尝试把域名送给麦当劳,但没有成功。不过,麦当劳对互联网的无知是个很有意思的故事,它后来变成了《连线》杂志上非常有名一篇文章。
当时的互联网还是一片广袤的处女地。无论你选择做什么,都能轻而易举地成为第一。消费者的期望不多,行业的壁垒又极低。做一个搜索引擎!当开网店的第一人!播放业余爱好者拍的视频!当然,这些都是当时。
现在看来,前几波的开拓者好像已经开疆拓土,把每一个可能的角落都开发得一干二净。他们留给今天这些后来者的,似乎只有困难和苦涩。30年后,互联网似乎会充斥着app、平台、设备和远远超过我们未来一百年的注意力所需求的内容。就算你能通过小小的创新榨出油水来,在那种极大丰富的环境里,又有谁会注意到呢?
但是问题在于,仅就互联网而言,什么都还没有发生呢!互联网仍然处在开端的开端。它只不过在变化而已。如果我们能够乘坐时光机前往30年以后,再从那时的视角来回顾现在,我们就会意识到,在2050年,大部分运转人类生活的伟大产品,在2016年以前,都还没被发明出来。未来的人们查看的会是全息投影,佩戴的会是虚拟现实隐形眼镜,呈现的会是可以下载的形象,操作的会是人工智能界面。他们回溯时会说,哦,你们那会还没真正地拥有互联网呢(没准互联网在未来已经有了别的名字了)。
那些未来人说得没错。因为从我们现在的角度来看,本世纪前半叶最伟大的网络事物已经出现在我们面前。只不过那些奇迹般的发明都在等着一个狂人以他的卓识远见来点化我们去采摘那些累累果实——这情形,就像是1984年的那些域名一样。
那些未来人说得没错。因为在2050年,会有另外一个白胡子老头问你:你能想象在2016年当一个发明家会有多棒吗?那是一片广袤的处女地!你随便找个什么东西,都可以加上人工智能,上传到云里面去。那时的设备里不像现在,传感器成千上百,很少有超过一两个的。那时的期望不多,壁垒很低。成为第一轻而易举。
而到那时,未来的人们会感慨:“唉,我们要是意识到那时有多少可能性该多好!”
所以真相就是:此时此刻,今天,2016年,就是创业的最佳时机。纵观历史,从来没有哪一天会比今天更适合发明创造。从来没有哪个时代会比当前、当下、此时此刻更有机遇,更加开放,有更低的壁垒、更高的利益风险比、更多的回报和更积极的环境。未来的人们回顾此刻时,会感慨道:“哦,要是活在那时该有多好!”
过去30年已经开创出了不可思议的起跑线——可以建造真正伟大事物的坚固平台。但即将到来的将会不同,将会超越现在,将会成为他物。而最酷的东西尚未发明出来。
今天确实是一片广袤的处女地。我们都正在“形成”。这在人类的历史上,是绝无仅有的最佳开始时机。
你没迟到。
[1] 美国科技博客techcrunch报道过,iphone应用的平均寿命少于30天。——译者注
[2] 指在17世纪~18世纪欧洲地区发生的一场知识及文化运动,该运动相信理性发展知识可以解决人类实存的基本问题。人类历史从此展开在思潮、知识及媒体上的“启蒙”,开启现代化和现代性的发展历程。——译者注
[3] 《星际迷航》(star trek)是美国的科幻影视系列。主要描述詹姆斯.t.柯克上校与联邦星舰进取号舰员们的星际冒险故事。——译者注
[4] 奇点理论(singrity)是一个根据技术发展史总结出的观点,认为技术发展将会在很短的时间内发生极大而接近于无限的进步。这一事件不可避免,而且转折点来临的时候,旧的社会模式将一去不复返,新的规则开始主宰这个世界。而后人类时代的智能和技术我们根本无法理解,就像金鱼无法理解人类的文明一样。——译者注
[5] 虚拟现实(virtual reality),简称vr技术,是利用电脑模拟产生一个三度空间的虚拟世界,提供用户关于视觉、听觉、触觉等感官的模拟,让用户如身历其境一般,可以及时、没有限制地观察三度空间内的事物。——译者注
[6] 网景浏览器scape navigator),是网景通信公司开发的网络浏览器,曾在20世纪90年代一度领先浏览器市场,后来在与微软ie浏览器的竞争中失败。firefox浏览器的前身是网景浏览器的开源版本mozi。——译者注
[7] 《新闻周刊》(newsweek),在美国和加拿大发行的新闻杂志,一度是仅次于《时代周刊》的美国第二大新闻类杂志。——译者注
[8] 全名克利福德·斯托尔(clifford stoll),曾在劳伦斯-伯克利国家实验werence berkley nationalboratory)担任网络管理员,并领导逮捕了20世纪80年代的著名黑客马库斯·赫斯(markus hess)。——译者注
[9] 尼古拉斯·尼葛洛庞帝,美国著名计算机学家,美国著名投资人,代表作有《数字化生存》(being digital)。——译者注
[10] “喷子”的原文为troller,英美国家的网络用语,意为在互联网争论中故意散布垃圾信息和虚假信息的人。该词有时还有中文网络用语中“钓鱼”的含义,即在网络上故意散布虚假信息吸引人认同,然后对其嘲笑。——译者注
[11] 美国俚语,指长时间坐在沙发上看电视的人。因为这类人体型大多肥胖,因此绰号“沙发马铃薯”。——译者注
[12] unix操作系统(尤尼斯),是一个强大的多用户、多任务操作系统,支持多种处理器架构,按照操作系统的分类,属于分时操作系统,最早由ken thompson等人于1969年在at&t的贝尔实验室开发。——编者注
[13] 万尼瓦尔.布什(vannevar bush),美国著名工程师,二战期间为曼哈顿计划发挥了巨大的政治作用。他在一篇文章中提出memex概念,可以看成是现代万维网的雏形。——译者注
[14] 依照一定编目规则记录图书资料的卡片,记录信息的卡片一般存放在图书馆卡片目录柜中供借阅者查询使用,是计算机普及前的主流图书馆检索方式之一。——译者注
[15] 美国最大的信息分类网站。——译者注
[16] 数据来自youtube官方网站。
[17] 阿米什人是基督新教再洗礼派门诺会中的一个信徒分支,以拒绝汽车及电力等现代设施,过着简朴的生活而闻名。——译者注
[18] 即通过游戏主机链接电视进行的电子游戏。——译者注
第2章 知化 cognifying
很难想象有什么事物会像廉价、强大、无处不在的人工智能那样拥有“改变一切”的力量。首先,没有什么比把迟钝的东西变聪明更富有成效。在某个现有进程中植入极少量有效的智能都会将其效率提高到全新水平。我们在知化[1],没有生气的物体后会得到许多的好处,而这对日常生活的颠覆将是工业化的百倍。但是让东西变智能不会带来极乐世界。与开发先前各种能源时一样,我们将把人工智能浪费在那些看上去愚蠢的事情上。当然,我们会运用综合智能解决诸如治愈癌症之类的科研难题,或是某个棘手的技术问题,但是把机敏的头脑置入普通事物之中才能带来真正的颠覆,这些事物可以是自动贩卖机、鞋子、书、报税单、卡车、电子邮件、手表以及手机。我们的日常行为将被彻底改变。
理想情况下,这种额外的智能只是廉价还不够,还应当完全免费。一项免费的人工智能技术和网页上的免费公共内容一样,比其他任何我们能想到的事情更能满足商业和科学的需求,并且很快就能自给自足。直到最近,传统的看法认为,超级电脑将首先成为这种人工心智的载体,然后是家中的个人电脑,接着我们会把它放进我们的个人机器人中。人工智能将是一些有界限的实体,而我们能清楚地区分我们和它们的思维。
事实上,真正的人工智能不太可能诞生在独立的超级电脑上。它会出现在网络这个由数十亿电脑芯片组成的超级组织中。它将是轻巧、嵌入式的,没有固定形态,并且内部的联系松散。把它的思维和我们的区分开会很困难。任何与这个网络人工智能的接触都是对其智能的分享和贡献。这种人工智能连接了70亿人的大脑、数万兆联网的晶体管、数百艾字节 [2] 的现实生活数据以及整个文明的自我修正反馈循环。那种单独的人工智能无法像它一样快速而聪明地学习。因此网络本身将会知化为一种完善速度惊人的事物。过时的独立综合智能技术可能会被看作是有缺陷的,它对于远离机动性人工智能的人来说简直是种惩罚。
当这种新兴人工智能问世的时候,它会由于无处不在,反而让人们无法察觉。我们会利用它不断增长的智慧处理各种单调的杂活,但它却无影无形。我们将能够通过地球上任何地方的电子屏幕,用数百万种方式获得它分布在各处的智能,因此很难说它到底在哪里。还因为这种综合智能结合了人类的智能(包括所有人类过去的智慧以及所有互联网上的人),要准确地指出它到底是什么也很困难。它是我们的记忆,还是我们的一种共识?是我们在搜索它,还是它在寻找我们?
人工智能思想的到来加速了本书中描述的其他所有颠覆性趋势的进程,它在未来世界中的威力与曾经的“铀元素”相当。我们可以肯定地说,知化是必然的,因为它已经近在咫尺。
大约两年前,我长途跋涉来到ibm研究实验室位于纽约州约克敦海茨的林间园区,想要尽早一窥让人期待已久的人工智能的到来。在2011年的《危险边缘》 [3] 中夺魁的超级电脑“沃森”就诞生于此。最初的沃森电脑仍被留在这里,它与一间卧室体积相当,10台貌似柜式冰箱的机器围成了四面墙,通过中间的微小孔隙,技术人员得以操作机器背后的电线和电缆。里面的温度高得出奇,让人觉得这个机群是活生生的。
如今的沃森与从前大不一样。它不再仅仅存在于一墙机柜当中,而是在大量开放标准的服务器之间传播。这些服务器可以同时运行上百个人工智能项目。只要能用手机、台式机或是自己的数据服务器连上沃森,它就像所有云端化的事物一样,同时为世界各地的客户提供服务。这类人工智能的规模可以根据需求进行调整。由于人工智能会随着人们的使用自我改进,沃森将越来越聪明,它在一个项目中习得的东西能够被立即运用到其他项目上。它并非一个单独的程序,而是多种软件引擎的集合,其逻辑演绎引擎和语言解析引擎可能使用不同的代码,分别在不同地点的不同芯片上运行,而所有这些都汇集成一条统一的“智能流”。
消费者可以直接连入这个不断运转的智能系统,也可以经由使用这个人工智能云端的第三方应用程序连入。就像许多聪明小孩的父母一样,ibm希望沃森从事医学工作,因而他们正在开发的应用程序中有一款是医疗诊断工具并不奇怪。之前,与诊断有关的人工智能尝试都以惨败告终,但是沃森确有实效。简单地说,当我告诉它自己在印度感染的某种疾病的症状后,它给我一张按照得病可能性由高到低排列的疾病推断清单。它声称我最有可能感染了贾第鞭毛虫,结果确实是这样。这项专门技术还未对病人直接开放,ibm让合作伙伴使用沃森的智能,帮助他们开发供病人预约医生和医院的用户友好界面。“我相信类似于沃森这样的机器(人)将很快成为世界上最好的诊断专家,”scanadu公司 [4] 的首席医疗官艾伦·格林(n greene)说道。这家创业公司受到《星际迷航》中医用三录仪的启发,正在借助沃森的人工智能制造一种诊断设备。他还说,“从人工智能技术的发展速度来看,现在出生的孩子在成年后可能很少需要依靠医生来诊断了。”
医学只是个开端。所有的主流云公司加上几十家创业公司都争先恐后地启动类似于沃森提供的认知服务。根据量化分析公司quid的数据,自2009年以来,人工智能已经吸引了超过170亿美元的投资。仅2014年,322家拥有类似人工智能技术的公司获得的投资就超过20亿美元。脸谱网和谷歌都为自己的人工智能研究团队招募研究员。2014年以来,雅虎、英特尔、dropbox、领英、pinterest以及推特都收购了人工智能公司。人工智能领域的民间投资在过去4年里平均每年增长62%,这个速度还会持续下去。
总部位于伦敦的deepmind是谷歌收购的早期人工智能公司之一。2015年,deepmind的研究人员在《科学》杂志上发表了一篇文章,描述了他们如何教人工智能程序玩20世纪80年代的街机类电子游戏,比如“电子弹珠台”(video pinball)。他们教它学习玩游戏的方法,而不是具体游戏的玩法,二者有着根本的区别。他们只是打开基于云端的人工智能,放手让它去玩雅达利(atari)公司的游戏——例如pong的变种breakout,它会学着如何不断提高分数。从实验记录影像上可以看出,人工智能的进步速度惊人。起初,人工智能几乎是在随机地玩,但它在逐渐进步。半小时后,每4次操作,它才失误1次。一小时后,它在第300局游戏中做到了零失误。之后,它继续飞快地学习,以至于在第二个小时里,它算出了breakout中的一个漏洞,而此前数百万人类玩家都没有发现。利用这个漏洞,它可以通过打通一面墙赢得游戏,这连游戏开发者也没想到。在没有deepmind开发者指导的情况下,一种叫做“深度强化机器学习”(deep reinforcement machine learning)的算法在接触49个雅达利游戏数小时后,能在其中约一半游戏中打败熟练掌握游戏的人类。
在所有这些活动中,一幅未来人工智能的图景正浮现出来,它既不像哈尔9000(hal 9000)这个由非凡(却有嗜杀倾向)的类人意识驱动的独立机器,也不像奇点 [5] 论者(singritan)迷醉的超级智能。即将到来的人工智能更像亚马逊的网络服务——廉价、可靠、工业级的数字智能在一切事物背后运行,除了闪现在你眼前的短暂时刻,它近乎无影无形。这种常见的设施会根据你的需求提供你想要的智能水平。即使人工智能改变了网络、全球经济以及文明,它也会像所有设施一样让人感到极度无聊。就像一个多世纪前电力所做的那样,它会让没有生气的东西活跃起来。如今我们将知化从前所有被电气化的东西。新的实用人工智能还会通过加深我们的记忆力,加速我们的认识能力等方法来强化个体以及全体人类的能力。通过注入额外的智能,我们几乎想不到什么东西不能变得新奇、不同和有趣。事实上,我们可以轻而易举地预测接下来10000家创业公司的商业计划:挑选一个领域并加入人工智能。
关于加入人工智能的神奇力量,摄影术是个很好的例子。20世纪70年代,我是个拖着笨重的摄影器材到处奔波的旅游摄影师。除了背包中的500卷胶卷外,我还扛着两个铜制尼康机身,一个闪光灯以及5个奇重无比(每个1磅)的玻璃镜头。光线暗的时候得用“大镜头”捕捉更多的光。摄影术要求一台用复杂而惊人的机械工程手段制造的密封相机在千分之一秒内聚焦、测量以及折射光线。那么后来的情况呢?如今我使用的尼康傻瓜相机的重量几乎可以忽略,在近乎黑暗时也能拍摄,焦距能从我的鼻尖一直延伸到无限远。显然,我手机里的相机更轻、更易用并且能和又重又老的家伙拍摄同样质量的照片。新相机体积更小、反应更快、声音更小且更便宜,这不仅是微型化造成的,还因为许多传统相机的功能被智能因素取代,摄影术被知化了。当今的手机照相机通过加入算法、计算以及智能成分淘汰了层层笨重的镜头,完成了物理镜头过去所做的工作。这些新相机使用无形的智能因素取代物理快门。而暗房和胶卷则被更多计算以及视觉智能因素取代。甚至有一种没有镜头的纯平相机,其中,纯平的光传感器代替了镜头,利用疯狂的计算识别能力,根据照在不聚焦的传感器上的不同光束,计算出一张图片。知化摄影术的结果是革命性的,它使得相机能塞进各个角落(太阳镜的镜框中、衣服上的某个色块中、写字的笔中),并能做更多事,如3d或高清计算以及其他曾经需要数十万美元以及一卡车设备才能进行的工作。现在,知化的摄影几乎成了任何设备都能完成的附带功能。
类似的转变将会发生在其他任何一个领域中。拿化学来说,一桌子盛满溶液的瓶瓶罐罐操作起来得费不少力气。移动原子岂不是更费劲?加入人工智能后,科学家们可以进行虚拟化学实验。他们在多如天文数字的化学结合中精挑细选,决定哪些更有希望成功,值得放在实验室中检验。语言学也有可能,比如把人工智能加入语言中,收录过去100年来书籍、杂志和报纸中出现过的数以亿万计的词,然后据此追踪新词的诞生。用这种智能可以打造全新的商标名。把人工智能用在法律上,用它在堆积如山的文件中寻找证据,识别案件中的矛盾,或是对法律论据的使用提出建议。
能够结合人工智能的行业多到数不尽。越是看似不可能的行业,加入人工智能带来的影响会越大。知化的投资呢?像betterment和wealthfront这样的公司已经投入实践。他们运用人工智能分析股票指数,优化避税方案或者平衡投资组合的持有比例。这些是一个职业资金经理每年会进行一次的工作,而人工智能每天或每小时都能做。
以下是另一些看似不太可能,却有望得到认知加强的领域:
知化的音乐——人们能运用各种算法即时创作电子游戏或虚拟世界中的音乐。音乐的变化取决于个人的操作。人工智能将为任意玩家创作数百小时的个性化音乐。
知化的洗衣——机器自动识别各类衣物的洗涤方式。智能衣物将指挥洗衣程序根据每次放入的衣物自行调整洗衣方案。
知化的营销——读者或观众个人关注一个广告时,其社会影响力能够成倍提高广告的受关注程度(取决于跟风的人数以及影响力的大小)。商家利用这一点,优化每一份投入的受关注度和影响力。当规模达到百万级别时,这项工作由人工智能完成。
知化的房产——人工智能匹配买方和卖方,并能够提示“喜欢这间公寓的租户还喜欢哪些房子等”。它还能根据你的个人经济状况生成一份财务计划。
知化的护理——遍布病人全身的传感器从早到晚地工作,提供高度个性化的护理方案,并每天做出调整和细化。
知化的建造——复杂工程项目和其众多子项目能被即时纳入计划表,使工程速度和预算得到优化。想象一下,一个足够智能的项目管理软件,不光能考虑设计改动,还会考虑天气、港口交通延误、汇率、意外事故等因素。
知化的伦理——自动驾驶汽车需要被事先教授优先级和行为规则。在考虑司机之前,它们或许应当首先保证行人的安全。任何依赖准则的真正自主事物都需要智能的伦理规则。
知化的玩具——玩具更像宠物。类似宠物的玩具对孩子深深的吸引力是菲比娃娃完全无法相比的。能交谈的玩具更受青睐。或许第一款真正的大众机器人就是一个洋娃娃。
知化的体育——智能传感器能带来新的计分和裁判方式。并且,我们每秒就从运动员身上提取高度细精化的数据,用来打造一个精华版虚拟体育联赛。
知化的编织——谁知道呢?但它迟早会出现!
世界的知化是一桩正在发生的重要事件。
2002年左右,我参加了谷歌的一个小型聚会。当时的谷歌是一家专注搜索的小公司,还未首次公开募股(ipo)。期间,我与谷歌出色的联合创始人——拉里·佩奇rry page)交谈时说道:“拉里,我搞不懂。已经有这么多家搜索公司,干嘛还要做免费网络搜索?这主意有什么好的?”我当时因为缺乏想象力而无法做出正确地判断,这恰好有力地证明了预测是困难的,尤其是预测未来。但我得为自己辩解一下,那是在谷歌加强广告拍卖方案并盈利之前,更别提后来发生的包括youtube在内的任何一宗大型收购。在所有谷歌搜索网站的狂热用户中,我不是唯一一个认为它撑不了多久的人。然而佩奇的回答让我一直难忘:“哦,我们其实在做人工智能。”
关于那次谈话,我在过去几年里想了很多。期间除了deepmind外,谷歌还收购了另外13家人工智能和机器人公司。乍看,你会认为谷歌正通过扩充人工智能方面的投资组合改善自己的搜索能力,毕竟搜索贡献了它总收入的80%。我认为事实恰恰相反。谷歌正利用搜索改善它的人工智能,而不是用人工智能强化它的搜索能力。每当你键入一个查询词,点击一个搜索引擎生成的链接或是在网上创建一个链接,你都是在训练谷歌的人工智能。当你在图片搜索栏输入“复活节兔子”(eastern bunny),就在告诉人工智能复活节兔子长什么样。谷歌每天处理的121亿次查询是在一遍又一遍地训练深度学习型人工智能。随着对人工智能算法的稳步改进,加上千倍的数据量以及百倍的计算资源,再过10年,谷歌将拥有一款无可匹敌的人工智能产品。我的预测是:到了2026年,谷歌的主营产品将不再是搜索,而是人工智能。
这个观点自然会遭到质疑。因为近60年来,人工智能的研究者都预测人工智能时代近在咫尺,然而直到几年前,人工智能似乎还是遥不可及。人们甚至把这个缺乏研究成果,更缺研究资金的时代称作人工智能的冬天。事情真的改变了吗?
是的。近期的三大突破将开启人们期待已久的人工智能时代。 廉价的并行计算
思考是人类固有的一种并行过程。我们大脑中的数百亿神经元同时激发,制造出用于计算的同步电波。建立一个神经网络——人工智能软件的基本结构,同样需要各个进程同步运行。神经网络中的一个节点大致类似大脑中的一个神经元,它能通过和周围节点的互动弄清接收到的信号。一个程序想要辨认出某个口语词汇,必须听到所有音素以及它们之间的关系,想要识别出某幅图片,必须同时看见每个像素以及它和周围像素的关联。这两者都是深度并行任务。但是直到最近,典型的计算机处理器每次还是只能执行一项命令。
十多年前,情况开始改变,当时出现的一种叫做图形处理器(graphics processing unit)或gpu的新型芯片是为了满足电子游戏中大量的视觉并行需求而设计的。游戏里的一张图片中包含的数百万像素需要在一秒内被多次重新计算,这就需要在主板上增加一块专门的并行芯片作为辅助。并行图像芯片运行效果极佳,电子游戏也大受欢迎。到了2005年,投入大量生产的gpu的价格已经与一般商品相当。2009年,吴恩达(andrew ng)和斯坦福大学的一个研究团队意识到gpu芯片可以并行运行神经网络。
这项发现让神经网络的节点之间能拥有上亿的连接,开启了神经网络新的可能性。传统的处理器计算拥有一亿节点的神经网络的级联可能性需要数周时间。吴恩达发现,一个gpu集群一天内就能完成同样的任务。如今,在gpu集群上运行神经网络被应用云计算的公司当作常规技术使用,如脸谱网用它来识别你照片中的好友,flix [6] 用它为超过5000万订阅用户推荐靠谱的内容。 大数据
每种智能都需要接受训练。尽管基因决定了人的大脑善于给事物分类,但人脑仍需要看过数十个实例才能区分猫和狗。人工心智更是如此。哪怕是程序编得最好的电脑也要对弈至少1000局国际象棋后才会有良好表现。人工智能之所以获得突破,部分是因为对全世界令人难以置信的海量数据的收集为人工智能提供了训练的条件。大规模数据库、自我追踪、网页cookies、网上足迹、太字节(tb)级别的存储、几十年的搜索结果、维基百科以及整个数字世界都成了让人工智能变聪明的老师。吴恩达这样解释道:“建设人工智能就像造一艘火箭飞船,需要一个巨大的引擎和许多燃料。飞船的引擎是各种学习型算法,而燃料是我们提供给这些算法的大量数据。” 更好的算法
数字神经网络在20世纪50年代就被发明出来,但是计算机科学家花费了几十年时间学习如何驾驭数百万甚至数亿神经元之间多如天文数字的组合关系。其中的关键在于将神经网络组织成叠层(stakedyers)。可以用相对简单的人脸识别任务举例。当神经网络中的一组数位被发现能触发某种图案,比如一只眼睛的图像,这个识别的结果(“啊,是只眼睛!”)会被移到神经网络的下一层级做进一步解析。下一层级可能会将双眼归在一组,并把这个有意义的数据块传到层级结构的更下一层级,该层级能够将双眼和鼻子的图案关联在一起。识别一张人脸可能需要数百万这类节点(其中每个节点产生一个计算结果供周围的节点使用),并需要叠加多达15个层级。2006年,当时就职于多伦多大学的杰夫·辛顿(geoff hinton)对这个方法做出了关键改进,并将其称为“深度学习”。他能对各个层的数据结果进行数学上的优化,从而加快了进一步叠层时的学习速度。数年后,当深度学习算法被移植到gpu集群上时,速度有了大幅提升。深度学习代码本身不足以产生复杂的逻辑思维,但它是当下所有人工智能产品的基本组成部分,这些产品包括ibm的沃森、deepmind、谷歌的搜索引擎以及脸谱网的算法。
由并行计算、更大量的数据、更深层次的算法组成的这场完美风暴,让酝酿了60年的人工智能仿佛一夜间获得成功。它们的组合表明,只要这些技术趋势继续下去——没有不继续的理由,人工智能就将持续进步。
这样下去,这种基于云端的人工智能愈将成为我们日常生活中根深蒂固的部分。但这是有代价的。云计算遵循收益递增(increasing returns)法则,有时又叫网络效应work effect)。这一法则指出,网络规模扩大的速度远远赶不上其价值增加的速度。网络规模越大,对新用户的吸引力越强,这就让它(的规模)变得更大,从而更具吸引力,如此往复下去。一个为人工智能服务的云端也将遵循这一法则。越多人使用人工智能,它就会变得越聪明;它变得越聪明,越多人就会使用它;当它更聪明时,就会有更多人使用它。一家公司进入这个良性循环后,规模会变得极大,发展速度极快,以至于对其他新兴竞争对手形成压倒性优势。结果就是,未来的人工智能将由两到三家寡头公司主导,并以基于云端的多用途商业产品为主。
1997年,沃森的前辈——ibm的(超级电脑)深蓝(deep blue)在一场著名的人机对弈中击败了当时具有统治地位的国际象棋大师加里·卡斯帕罗夫(garry kasparov)。当电脑又赢得了几场比赛后,人类选手基本上对这种比赛失去了兴趣。你或许会认为这就是故事的结局(如果不是人类历史的终结),但卡斯帕罗夫意识到,如果他也能像深蓝一样即时访问包含先前所有棋局中棋路的大规模数据库,就能表现得更好。如果人工智能选手使用数据库工具被认为是公平的,那么人类为什么不能使用呢?为了实现用数据库加强人类大师的心智的想法,卡斯帕罗夫率先提出了“人加机器”(manplus-machine)的概念,即在比赛中用人工智能增强国际象棋选手水平,而不是让双方互相对抗。
如今,这种比赛被称为自由式国际象棋比赛,它们和混合武术对抗赛相似,选手们可以使用任何他们想用的作战技巧。你可以在没有协助的情况下比赛;也可以成为极其聪明的国际象棋电脑的傀儡,仅仅按照它的指示移动棋子;或者你可以当一个卡斯帕罗夫提倡的“半人马”型选手,也就是人类和人工智能结合的赛博格(cyborg) [7] 。这种选手会听取那些人工智能提出的走棋建议,偶尔也会否决他们,颇似我们开车时使用gps智能导航的情景。对任何模式的选手开放的2014年自由式国际象棋对抗锦标赛上,纯粹使用人工智能国际象棋引擎的选手赢得了42场比赛,而“半人马”型选手则赢得了53场。当今世界上最优秀的国际象棋选手队伍就是“半人马”型的intagrand,它由一个人类团队和几个不同的国际象棋程序组成。
但更让人意外的是人工智能的出现并未削弱纯人类国际象棋选手的水平。恰恰相反,在廉价且超级智能的国际象棋软件的激励下,下国际象棋的人数、锦标赛的数量以及选手的水平都达到了历史之最。与深蓝首次战胜卡斯帕罗夫时相比,拥有国际象棋大师头衔的人数至少翻了一番。现今排名第一的人类国际象棋选手马格努斯·卡尔森(magnus carlsen)就曾和人工智能一起训练,并且被认为是所有人类国际象棋选手中最接近电脑的一个。他还是有史以来评分最高的人类国际象棋大师。
既然人工智能可以帮助人类成为更优秀的国际象棋选手,那么合理地推测,它也能帮助我们成为更优秀的飞行员、医生、法官、教师。大多数人工智能完成的商业工作都将由专注某个狭小领域的专门化智能软件负责。比方说,它能把某种语言翻译成另一种语言,但不能干别的;它可以开车,却不能和你交谈;它能记得youtube上所有视频里每个像素,却无法预测你的日常工作。在接下来的十年里,与你产生直接或间接互动的人工智能产品有99%都将是超级智能的自闭型“专家”。
事实上,这并非真正的智能,至少不是我们细想后希望得到的。其实智能或许是种累赘,如果说“智能”意味着我们特有的自觉意识、疯狂的自省循环以及凌乱的自我意识流,那么结论尤其如此。我们希望自动驾驶汽车能够超乎常人地专注于道路,而不是在纠结之前和智能车库之间的争执。医院里的综合“沃森”医生能一心扑在工作上,永远不要去想当初是不是该学金融专业。随着人工智能的发展,我们可能要设计一些手段阻止它们拥有意识,而当我们宣传最优质的人工智能时,很可能给它打上“无意识”的标签。
我们想要的不是智能,而是人工智慧。与一般的智能不同,智慧是专注的、能衡量的、专门化的。它还能够用完全不同于人类认知的方式思考。2014年3月,得克萨斯州奥斯汀西南偏南音乐节(south by southwest festival)上的特技表演就是一个关于非人类思维的精妙例子。当时ibm的研究员给沃森加入了一个烹饪数据库,其中包含网上菜谱、美国农业部(usda)营养成分表以及如何让配方更可口的研究报告。凭借这堆数据,沃森从味道资料以及现有的菜式中创制出新菜品,厨师则很乐意地把它们做出来。众人最爱的一道菜是美味版的“鱼和薯条”(fish and chips),它是用酸橘汁腌鱼和油炸车前草制成。在约克敦海茨的ibm实验室吃午饭时,我津津有味地品尝着这道菜以及另一道沃森的发明:瑞士/泰式芦笋乳蛋饼。味道不赖!这两道菜怎么看都不像是人类所能想到的。
非人类智能不是一个程序错误,而是一项功能。会思考的机器最重要的特征就是它们思考的方式与人类有差别。
由于进化过程中的一种巧合,我们成为漫游在这个星球上唯一拥有自我意识的物种,这让我们误以为人类的智能是独一无二的。然而它不是。我们的智能只是某个特定社会的智能,和宇宙中可能存在的其他智能和意识种类相比,它只占据一个小小的角落。我们喜欢把人类的智能看作是“通用的”,因为和我们遇到的其他心智相比,人类的心智能解决更多种类的问题,但是当我们创建了越来越多的综合心智后,我们开始意识到人类思维并不通用,它只是思维的一种。
今天,不断涌现的人工智能的思维方式就与人类不同。它们在完成诸如下国际象棋、开车、描述一张照片的内容等我们曾认为只有人类能做的事情时,使用的方法也与我们不同。脸谱网通过加强他们的人工智能,能让它在看过一个人的照片后就能从网上约30亿人的照片中识别出此人。人脑无法提升到这种程度,因此这种能力完全是非人类的。众所周知,我们的思维方式不擅长做统计,所以我们制造出各种统计技术很强的智能设备,是为了让它们用不同的方式思考。让人工智能替我们开车的一项优势就是,它们不像我们那样容易分心。
在一个联系超密集的世界中,不一样的思维是创新和财富的来源。仅仅聪明是不够的。商业动机会让与工业力量相关的人工智能无处不在,它们廉价而聪明,会被植入到所有我们制造的东西里。当我们开始发明新的智能种类和新的思维方式时,将获得更大的回报。我们目前还不了解智能的完整分类法。有些人类思维的特点将会是通用的(就像生物学中的左右对称性、细胞分裂、管状脏器)。但是很可能存在某种心智种类,和我们演化的结果大不相同,其思维方式并非一定要比人类更快、更强大、更深刻,有时反而更简单。
宇宙中潜在的心智种类数量庞大。最近,我们开始研究地球上动物的心智,而期间已经见到了许多其他种类的智能,伴随着更多的发现,我们会愈加尊重这个事实。鲸和海豚复杂而奇特的智能不断带给我们惊喜。很难设想如何准确地判断出一种心智比我们更高级。一种便于我们设想的手段就是着手建立一门心智分类学。这个心智的矩阵将包括人类心智、机器心智以及可能存在的心智,尤其是类似科幻小说家虚构的那种超越人类的心智。
这种异想天开的尝试是值得的,因为我们一定会在所有产品中加入智能,但加入哪种特质的智能并非显而易见,而是有选择空间的。智能的特质将会决定其经济价值以及它们在我们文化中的角色。列出机器在哪些可能的方面比我们(即便是在理论上)更聪明将会帮助我们调整并约束智能的发展。一些非常聪明的人,如天文学家斯蒂芬·霍金,以及天才发明家埃隆·马斯克(elon musk)担心,创造聪明绝顶的人工智能是个错误,因而探究更多智能种类显得更为明智。
假设我们登上了一个外星球,如何衡量我们在那里碰到的智能的水平?这是一个极难回答的问题,因为我们对自己的智能并没有一个真正的定义(部分是因为至今为止我们不需要)。
现实世界遵循补偿的法则,哪怕在强大心智的世界中也是如此。一种心智并不能把所有工作都完成得很好。一类特定的心智在某些方面的表现更为出色,在其他方面就会有所欠缺。比如,指导自动驾驶汽车与评估房产是两种差异很大的智慧;诊断疾病与监控住宅的人工智能所用的智慧有天壤之别;能准确预测天气的超级大脑与植入衣服中的智能分属两个完全不同的心智领域。心智分类学必须能反映出如何运用不同方法设计出具有补偿特点的心智。下面这份候选清单中我只列出了那些可能比我们更高级的心智,我排除了数千种将会大规模知化的物联网中那些平常的机器智慧,比如一个计算器中的智能。
一些新的心智包括:
·一种心智与人类的心智相像,只是反应更快(我们最容易想到的人工智能)。
·一种心智主要基于大容量存贮和记忆,有些愚钝但是信息面广博。
·一种全球化超级心智,由数百万做着单调工作的智能体组成。
·一种蜂巢型心智,由许多十分聪明的心智组成,但是自己却意识不到。一种博格型(borg)的心智,组成它的许多聪明心智意识到它们构成了一个整体。
·一种心智被专门训练用来加强指定的人类个体,但是对其他人完全无效。
·一种心智能够设想但不能制造比自身更强大的心智。
·一种心智能够制造比自身更强大的心智,由于自我意识不足,无法设想自己制造的心智。
·一种心智能够制造比自身更强大的心智。
·一种心智能够创造比自身更强大的心智,而被创造出的心智能继续这么做。
·一种心智拥有自身源代码的访问通道,因此可以修改自己的进程。一种心智逻辑能力超强并且没有情感。
·一种心智能解决普遍问题,但没有自我意识。
·一种心智具有自我意识,但不能解决普遍问题。
·一种心智成长期很长,并且在它成熟前需要一个保护者。
·一种很缓慢的心智,覆盖了很长的物理距离,因而在快速的心智看来,它是“隐形的”。
·一种心智能够多次克隆自己。
·一种心智能够克隆自己,并且与克隆体组成一个整体。
·一种心智能从一个平台迁移到另一个平台从而保持永生。
·一种快速、动态的心智,能够改变自己的认知进程。
·一种纳米级的心智,它是所有可能的超级心智中(尺寸和能耗数据)最小的。
·一种心智专门提出设想并做预测。
·一种心智从不抹去或忘记任何事情,包括错误或虚假的信息。
·一种半机器半动物的共生心智。
·一种半人半机器的赛博格心智。
·一种使用量子计算的心智,我们无法理解它的逻辑。
如果上述任何一种心智能够成为现实,也将发生在20年开外的未来。这张预测清单的重点在于所有的认知功能都是专门化的。从现在直到未来百年,我们制造的人工心智都将会是为专门任务而设计,并且通常是超越我们能力的任务。我们最重要的机械产品不是某样事情比人类做得更好,而是能做人类完全做不了的事情。同理,我们最重要的思维产品也将不是比人类想得更快、更好,而是能思考人类无法思考的事情。
想要真正解决当前关于量子引力、暗能量以及暗物质高深复杂的谜团,我们可能需要人类以外的其他智能。并且想要解决这些问题带来的更为困难的极端复杂问题,我们或许需要更不同、更复杂的智能。实际上,我们可能还要发明中间水平的智能,来帮助我们设计那些我们无法独自设计出来的更精密的智能。我们亟需不同的思维。
如今,许多科学发现要靠数百个人类的心智共同完成,而在不久的将来,或许会有很多十分艰深的问题,得借助数百种不同类型的心智才能解决。到那时,我们不会那么容易接受异类智能提供的答案,这将把我们带到文化的边缘地带。当我们在认可计算机做出的数学证明后感到不舒服时,这种情形已经出现了。与异类智能打交道是一项新技能,也是对我们自身的开拓。人工智能的植入会改变我们的科研方式。非常智能的工具会加快我们的测量速度并改变我们的测量方法;海量的即时数据会加快我们的模型思维速度并改变我们的模型思维方式;极具智慧的记录手段会加快我们了解事情的速度并改变我们“了解”的方式。科学方法是一种认识的手段,但它向来都是从人类的视角出发的。当我们把一种新的智能加入科学方法,科学一定会以不同的方式去认识和发展。到那时一切都将改变。
人工智能(ai)也可以表示异类智能(alien intelligence)。宇宙中有十亿颗类地星球,我们无法确定未来200年内是否会接触到其中一颗上的地外生命,但几乎可以100%确定我们会制造出异类智能。当我们面对这些人造异类时将和遇到外星人一样,既会受益也会遭到挑战。它们会迫使我们重新评估自身的角色、信仰、目标和身份。人的目的是什么?我相信有一个答案是:我们要制造生物演化无法得到的新型智能。我们的职责就是制造能够用不同方式思考的机器,也就是创造异类智能。我们确实应该把各种人工智能称作“异类智能”。
人工智能会像外星人一样,用和任何人类厨师大不相同的方式对待食物,这将促使人类对食物进行不同的思考。这个例子同样适用于材料的制造、服装、金融衍生品、任意门类的科学和艺术。与人工智能的速度和力量相比,它的相异性对我们来说会更有价值。
如此一来,人工智能可以让我们更好地理解起初所说的智能的含义。过去,我们或许会说,只有那种具有超级智能的人工智能才能驾驶汽车,或是在《危险边缘》以及国际象棋中战胜人类。但是当人工智能做到了这些,我们就认为这些成就显然是机械的,几乎不能被称为真正的智能。人工智能的每一次成就都将自己重新划为“非人工智能”行列。
但是我们不仅在重新定义人工智能,也在重新定义人类。过去60年里,机械过程复制了我们过去认为人类独有的行为和能力,我们不得不改变关于人和机器之间差别的看法。当我们发明了更多种类的人工智能后,会在“什么是人类独有的”这一问题上做出更大让步。我们将在未来的30年,甚至一个世纪里陷入一种旷日持久的身份危机,不断扪心自问人类的意义。最大的讽刺是,日常生活中那些实用的人工智能带给我们最大的益处将不在于产能的提高、富足的经济或是新的科研方式,尽管这些都显而易见。人工智能时代的到来最大的益处在于,各种人工智能将帮助我们定义人性。我们需要人工智能告诉我们——我们是谁?
未来几年里,那些被赋予实体的异类智能将获得我们最多的关注。我们把它们叫做机器人。它们同样会有各种不同的形状、体积和功能配置。机器人已经低调地走进了我们的生活。不久,更张扬、更聪明的机器人必将出现。它们所带来的颠覆效果将直抵我们生活的核心。
试想,如果明天10个美国工人中就有7个会失业,他们该怎么办?
如果超过一半的劳动人口都拿到了解雇通知书,很难相信一个经济体还能继续存在。事实上,工业革命就让19世纪初的劳动力面临这种状况,只不过事情发生得较为缓慢。两百年前,70%的美国劳动力以农场为生。后来,自动化实现后,机器代替了农民以及在农场作业的动物,淘汰了大多数人的工作,只留下1%左右。但是被取代的农民并没有就此闲着。自动化转而在全新的领域中创造了亿万份工作。曾经务农的人如今操纵着工厂中炮制农具、汽车以及其他工业产品的机器。从此,一浪又一浪建立在自动化之上的新职业潮水般袭来,包括家用电器维修工、胶印工人、食品化学家、摄影师、网站设计师。今天,我们大多数人从事的工作是19世纪的农民无法想象的。
或许很难令人相信,但在本世纪结束前,如今人们从事的职业中有70%很可能会被自动化设备取代。不用说,亲爱的读者,你的工作会也会被机器取代。换句话说,机器人取代人工是必然的,一切只是时间问题。第二次自动化浪潮正引领这项变革,而人工认知、廉价传感器、机器学习和分布式智能将成为变革的焦点。广泛的自动化将会触及包括体力劳动和知识型工作在内的所有工种。
首先,已经实现自动化的行业中,机器会进一步巩固自身的地位。当机器人取代流水线工人后,它们会接着取代仓库工人。麻利的机器人能够从早到晚不断地抬起150磅的重物。它们把箱子取出来,分好类,然后装上卡车。这种机器人已经在亚马逊的仓库工作了。采摘水果和蔬菜的过程也将逐步由机器人接手,最后只有在特色农场里才能见到人类在采摘。药房里将会有一个配药机器人在后台工作,而药剂师专心回应病人的咨询。实际上配药机器人的雏形已经问世,目前正在加利福尼亚州的医院里工作。它们至今还未出现过一次弄错处方上要求的状况,这对人类药剂师来说很难做到。接下来,打扫办公楼这种相对精细的杂活也将由机器人在半夜完成。它们从简单的打扫地面和窗户开始,最终完成清洁厕所的要求。长途货运客车在高速公路上行驶时,将由驾驶室内置的机器人进行驾驶。到2050年,大多数货车将实现无人驾驶。鉴于货车司机是目前美国最普遍的职业,这件事的影响不容小觑。
机器人的触角终究会伸向白领工作。许多机器已经含有人工智能,我们只是没有称它们为人工智能机器人。请看谷歌最新的计算机之一,它能够为任意一张给定的照片写下准确说明。选取一张网上的照片后,它会“看着”这张照片然后给出完美的说明。它能持续地像人类一样正确描述照片上发生的事,却不会感到疲倦,还能阅读并概括出文本大意。任何与大量文书工作相关的岗位都可以由机器人从事,这其中就包括不少医疗岗位。任何较为机械的资讯密集型工作都能被自动化。无论你是一名医生、律师、建筑师、记者甚至程序员,机器人都将历史性地接管你的工作。
我们已经处在转折点上。
我们对于一个智能机器人的外形和行为已经有了先入为主的印象,这让我们意识不到身边发生的变化。要求人工智能效仿人类的智能,好比要求人工飞行模仿鸟类翅膀,在逻辑上是说不通的。
巴克斯特(baxter)是rethink robotics公司的新型作业机器人。它的制造者是发明畅销吸尘器鲁姆巴(roomba)系列产品的前麻省理工学院教授罗德尼·布鲁克斯(rodney brooks)。巴克斯特是一款较早被用来辅助人类工作的新级别工业机器人,但它看上去貌不惊人。当然,它和许多其他工业机器人一样有一条强壮的机械臂。巴克斯特的双手和工厂机器人一样,能进行重复性的手工劳动。但是它和一般的工厂机器人之间有着三方面的重要区别。
第一,它能向四周看并且可以通过移动头部的动画眼睛提示它正在看的地方。它能感知附近工作的人类从而避免伤到他们,工人们也能知道自己是否被它看到。之前的工业机器人无法做到这些,这就意味着工作中的机器人必须与人类保持距离。典型的工厂机器人被关在一个铁丝网围栏或是玻璃笼子里。它们意识不到他人的存在,因此放在人的周围太过危险。这种机器人无法在一家难以将它们与人隔开的小商店中工作。理想情况下,工人应该能够在机器人身上存取材料,或者在日常工作中手动调整机器人的控制参数,而双方被隔开的话,此类动作就难以实现了。但巴克斯特能和人类做伴。它们使用力反馈(force-feedback)技术来感知自己是否触碰到人或另一个机器人,显得彬彬有礼。你可以在自家的车里接通它的电源,从容地在它身旁工作。
第二,任何人都能训练巴克斯特。它不一定像其他工业机器人一样迅捷、强大或精准,但它更聪明。要想训练它,你只需要抓起它的双臂并引导它们按照正确的次序做动作。这是一种“照着做”的训练方法。当巴克斯特学会动作后,就会不断重复练习。包括文盲在内的任何工人都可以进行这种展示。想要命令之前的作业机器人做最简单的任务改变,需要高度受教育的工程师和训练有素的程序员写数千条代码,还要进行调试。代码必须用批处理模式(batch mode)载入,比如大型非常用批处理文件。因为机器人一旦投入使用就不能被重新编程了。结果典型工业机器人的大量花费不是来自硬件而是它的运营成本。工业机器人的购买价为10万美元,然而在整个使用期中编程、训练和维护的费用是购买费用的4倍多。这些费用累加后,平均每个工业机器人的总花费超过50万美元。
第三个区别就在于巴克斯特更便宜。定价2.2万美元的巴克斯特与它的前辈机器人50万美元的总花费相比不在一个数量级上。使用批处理模式编程的老牌机器人就好像机器人界的大型主机,而巴克斯特好比第一台个人电脑。由于缺乏某些重要性能,如亚毫米级的精确度,这种机器人很可能沦落为机器爱好者的玩具。但是与个人电脑一样,却不同于过去大型主机的是:在不需要专家调试的情况下,用户可以即时与它进行直接交流,并且可以用它来做不太紧急,甚至是鸡毛蒜皮的事。它的价格足够低廉,因此小型工厂可以购买一台用来打包成品、喷涂定制化产品或者操作3d打印机。或者你也可以让它在生产iphone的工厂充当工人。
巴克斯特诞生在波士顿查尔斯河畔一幢拥有百年历史的砖墙建筑中。1895年,这幢建筑是位于当时新制造业世界中心的一个奇迹。它甚至能发电供自己使用。百年来,这座围墙内的工厂改变了我们身边的世界。如今巴克斯特的性能以及即将到来的大量高级机器工人促使布鲁克斯思考一个问题:这些机器人会如何比上一次革命更彻底地颠覆制造业?看着办公室窗外那些比邻的工厂,他说道:“现在我们提到制造业就会想到发生在中国的情形。但是随着机器人带来的制造成本下降,运输的成本将成为远比生产成本更重要的因素。距离近就代表低成本。因此我们会看到这种本地特许经营的工厂组成的网络,所有的东西将在距离需求地5英里以内的范围内生产。”
这些对生产行业来说或许是正确的,但是许多人从事的是服务业。我请求布鲁克斯和我一起穿过一家当地麦当劳餐厅,并让他指出哪些工作可以被他的机器人取代。他犹豫着表示:“指望机器人为我们当厨师恐怕要等30年。在一家快餐店中,你不会一直干一种活,而是忙于在不同的任务之间转换,因此你需要一种特定的解决方案。我们不提供特定方案。我们正在打造一种能在人类身旁自主运行的机器人。”当我们能够与身边的机器人协同工作时,双方的工作内容必然会掺杂在一起,不久我们过去干的活将会由它们承担,而我们难以想象自己日后的新工作会是什么。
我根据人类和机器人的关系把工作分为四大类,希望能帮助我们更好地了解机器人将怎样取代人类。
人类能从事但机器人表现更佳的工作
人类需要花大力气动手织布,然而只用几分钱,自动织布机就可以织出一英里的布。如今,对手工中不完美的留恋,是我们购买手工纺织品的唯一理由。但是没有人想要一辆有瑕疵的汽车。谁也不愿意驾驶一辆性能不稳定的汽车以70英里时速在高速公路上飞驰。因此我们认定,在汽车的生产过程中人参与的程度越低越好。
我们仍然错误地认为,不能信任计算机和机器人在更为复杂的事务中的表现。因此我们不愿意积极地承认它们掌握了部分常规的抽象工作,并且在特定情况下,甚至比体力劳动做得更好。一种由计算机控制的装置被称作自动驾驶仪,它能在没有任何辅助的情况下驾驶一架波音787客机完成一次标准的飞行,其中只有8分钟时间完成起来有难度。驾驶舱中的人类驾驶员只需要完成这8分钟的飞行任务以及应对突发状况,而需要人操控的时间正在持续减少。20世纪90年代,计算机大规模取代人类,为房屋抵押贷款作评估。大部分税务工作、常规的x光片分析以及审前证据收集工作都由计算机处理,而这些都曾是领着高薪的聪明人干的活。我们已经接受机器人从事制造业是可靠的,不久我们就会接受它们的智能和服务。 人类不能从事但机器人能从事的工作
举个琐碎的例子,人类想造出一枚铜螺钉都很困难,而自动化技术可以在一小时内生产一千枚。没有自动化,我们连一块计算机芯片也造不出来,因为这种工作需要人类身体不具备的精准、控制力和坚定不移的注意力。同样,无论受教育程度有多高,没有一个人或一群人能快速搜索世界上所有的网页,找到包含尼泊尔首都加德满都鸡蛋价格的网页。任何时候你在点击搜索按钮时,都是在雇用一个机器人帮忙完成我们这个物种无法独立完成的事情。
当过去人类从事的工作一项一项被机器人取代的消息不断登上新闻头条后,机器人和自动化将主要通过承担人类无法胜任的工作为人类谋福利。我们没有ct扫描仪器那样的注意广度,能够通过对每平方毫米范围的搜索寻找癌细胞。我们没有将融化的玻璃变成瓶子所需要的毫秒级反应能力。我们没有完美的记忆力,能记住美国职业棒球大联盟(major league baseball)中的每一次投掷,并且实时计算出下次投掷的成功率。
我们不会把“好工作”交给机器人。大多数时候,我们只是把自己做不了的工作交给它们。没有它们,这些工作将永远无法完成。 人类想要从事却还不知道是什么的工作
在机器人和计算机智能的协助下,我们得以完成150年前完全无法想象的事情,这是机器人介入人类生活后最令人赞叹的一点。今天,我们可以通过手术摘除内脏上的肿瘤,录制婚礼视频,让登陆车在火星上行驶,在布料上印出朋友通过电波传来的图案。我们正在进行的100万种有偿或无偿的新活动会让19世纪的农民觉得眼花缭乱并感到震惊。从过去的角度看,这些新的成就不仅仅困难,而且主要是由那些能够完成它们的机器创造出来的。它们是由机器设计的工作。
在我们发明汽车、空调、平板显示器以及动画之前,住在古罗马的人不会想到他们能一边看动画片,一边吹着空调前往雅典,但我最近就这么干过。200年前,没有哪个中国老百姓会告诉你,他们要买一小块用来和远方的朋友对话的玻璃面板,而不是家里的下水道系统。如今,没有现代下水道系统的中国农民却去购买智能手机。第一人称射击游戏中内置的精巧的人工智能技术,给了数百万青春期男孩成为职业游戏设计师的动力和需求,而这种梦想是维多利亚时期的男孩不会拥有的。自动化每一次微小的成功都会催生一些新职业,没有自动化的促进,我们不会想到这些职业。
需要重申的是,自动化创造的大多数新任务也只有其他的自动化技术能处理。如今,我们拥有谷歌这样的搜索引擎,就指望它们能干千百种新差事。人们会问:“谷歌,你能告诉我手机放哪儿了吗?谷歌,你能帮抑郁症病人找到卖相关药物的医生吗?谷歌,你能预测下一次病毒性传染病的爆发吗?”技术会不加区分地把各种可能性和选择堆放在人和机器面前。可以打赌,到了2050年,薪资最高的行业将依赖目前还没有发明的自动化技术和相关机器。也就是说,我们不知道这些工作,是因为让这些工作成为可能的机器和技术还未出现。机器人创造了我们想要从事却还不知道是什么的工作。 (刚开始)只有人类能从事的工作
至少在很长一段时间内,人类想做什么是由人类而不是机器人决定的。这句话并不是一句多余的表述,事实上,人类发明的东西唤起了自身的欲望,因此人类的需求和机器人之间互为因果。
当机器人和自动化过程包办了我们的大多数基础工作,让我们的吃、穿、住变得相对容易时,我们就会闲下来并且自问:“人的目的是什么?”工业化不仅延长了人类的寿命,还让很大一部分人认为,人类理应成为芭蕾舞演员、专职音乐家、数学家、运动员、服装设计师、瑜伽大师、同人小说作者或是拥有名片上那些独一无二的头衔。在机器的帮助下,我们才能担当这些角色。当然,随着时间的推移,机器也会从事这些工作。接下来,面对“人类应该做什么”这个问题,我们会想到更多的答案。但是机器人想回答这个问题还要等到多年以后。
后工业化经济将会持续发展。因为每个人的任务之一将是找到、从事并完成将来会成为机器人重复性劳动的新工作。不久的将来,机器人驾驶的轿车和卡车随处可见。这项新的自动化技术会为以前的卡车司机带来一份叫做行程优化师的新工作。工作的内容就是通过调整运输系统的算法达到节能省时的效果。外科手术机器人成为常规后,让复杂机器保持无菌状态将成为必要的医疗新技术。追踪个人所有活动的自动化自我追踪技术成为常态后,将会出现一种新的专业分析师,为你解读数据。当然我们还需要一大批负责维护你的个人机器人正常运转的保姆。今后,所有这些职业也将逐个被自动化接管。
当人人都拥有召之即来的个人机器人,也就是巴克斯特的后继者们,真正的变革就开始了。想象一下,你是0.1%依然从事农业的人群中的一员,打理一家直接向客户供货的小型有机农场。虽然你仍然是一个农民,但是机器人承担了大部分的农活。分布在泥土里的细小探针指导你的机器人队伍在炎炎夏日里播种、治虫、收割。你作为农民的新任务将是监管整个农耕系统。某天,你可能会研究一下应该种植祖传番茄的哪一个变种;第二天试着发现客户的需求;接下来的一天更新你的客户群。其他所有能被量化评估的任务都由机器人完成。
如今,这一切似乎难以想象。我们无法想象一个机器人能把一堆散件组装成一件礼品,或是制造除草机的配件,抑或是为我们的新厨房制作需要的材料。我们无法想象自己的外甥或侄女在他们的车库里操纵一堆作业机器人,为朋友的创业公司大量生产电动车逆变器。我们无法想象自己的子女成为家用装置设计师,制造一批定制化液氮(分子)甜品机并卖给中国的富豪们。然而,个人机器人自动化系统能将这一切变为现实。
虽然,几乎人人都能得到个人机器人,但是仅仅拥有一个机器人并不是成功的关键。成功将青睐那些以最优化的方式与机器人以及机器一同工作的人。产品的地理集群性差异将会凸显,但各个集群的差别不在于人工成本,而在于人的专业技能。人类和机器之间将形成一种共生关系。人类的工作就是不停地给机器人安排任务,这本身就是一项永远做不完的工作,所以,我们至少还能保留这份“工作”。
将来,我们和机器人的关系会变得更复杂。同时,一种循环出现的模式值得我们注意。无论你现在从事什么工作,收入水平如何,都将反复经历机器人替代人的以下7个步骤:
1.机器人(电脑)干不了我的工作。
【后来】
2.好吧,它会许多事情,但我做的事情它不一定都会。
【后来】
3.好吧,我做的事情它都会,但它常常出故障,这时需要我来处理。
【后来】
4.好吧,它干常规工作时从不出错,但是我需要训练它学习新任务。
【后来】
5.好吧,就让它做我原来的工作吧,那工作本来就不是人该干的。
【后来】
6.哇,机器人正在干我以前做的工作,我的新工作不仅好玩多了,工资还高!
【后来】
7.真高兴,机器人(电脑)绝对干不了我现在做的事情。
【重复】
这不是一场人类和机器人之间的竞赛,而是一场机器人参与的竞赛。如果和机器人比赛,我们必输无疑。未来,你的薪水高低将取决于你能否和机器人默契配合。90%的同事将会是看不见的机器,而没有它们,你的大部分工作将无法完成。人和机器的分工也将是模糊的,至少在开始时,你可能不会觉得自己在干一份工作,因为看上去所有的苦差事都被机器人承包了。
我们需要让机器人接手。许多政客们极力阻止机器人接手的那些人类工作,实际上是人们不情愿干的。机器人能干那些我们正在干的事情,而且远比我们干得好;机器人能从事那些我们从事不了的工作,能做那些我们从没想到需要去做的工作;机器人还能帮助我们发现自己的新工作,发现那些让我们拓展自身意义的事。
这一切都是必然的。让机器人代替我们从事现在的工作,让我们在它们的帮助下去构想有意义的新工作吧。
[1] 知化意为赋予对象认知能力。——编者注
[2] 艾字节,exabyte,缩写eb,常用来标示网络硬盘总容量。1eb=1024pb=1073741824gb。——编者注
[3] 一档非常受欢迎的美国智力竞赛节目。——编者注
[4] 硅谷的一家科技公司,他们利用移动与感官技术研发移动医疗设备。——编者注
[5] “奇点”本是天体物理学术语,著名未来学家雷·库兹韦尔用它来指人类与其他物种(物体)的相互融合。——编者注
[6] 美国网络视频服务商,以dvd出租业务起家,提供网络视频付费订阅观看服务,收录内容大部分是有版权的作品。除网络视频业务之外,该公司目前还保持dvd出租业务。——译者注
[7] 赛博格(cyborg),最早出现在科幻小说中,现在已经逐渐变为现实。指用机械替换人体的一部分,从而将大脑与机械联接起来。——编者注
第3章 流动 flowing
互联网是世界上最大的复印机。在最根本的层面上,它将我们使用它时所产生的一切行为、一切特征、一切想法拷贝成了复制品。为了将信息从互联网的某个角落传输到另一边,通信协议让信息在传输过程中经历了数次的复制。在平常日子里,部分数据在内存、缓存、服务器和路由器之间循环往复,期间或许已经被复制了数十次。科技公司们也在销售这些永不停息的复制设备上赚到了大钱。如果一样东西可以复制,那么当它接触到互联网之后,就必然会被复制。
数字经济就是这样运转在自由流动的复制品河流中的。实际上,我们的数字通讯网络经过设计,尽可能地减少了复制品流动的阻力。复制品流动如此自由,以至于我们可以把互联网想象成一个超导体。进入这个系统的复制品能够通过网络无休止地流动下去,就像超导电线中的电流一样。病毒式传播的含义便在于此。复制品经过复制,进而产生新的复制品——由此泛出一道道波纹,向外荡散开来。复制品一旦接触互联网,就再也不会离开。
这种超级分配系统已经成为了我们经济和财富的基础。信息、创意和资讯的实时复制加强了21世纪经济中的主要部分。美国对外出口的软件、音乐、电影和游戏价值连城,都是易于复制的产品。而制造它们的产业是美国全球竞争优势的所在。美国的财富因此建立在一台能够迅速、混杂地复制信息的巨大机器之上。
我们不能阻止大规模的自由复制。这样做不仅会破坏创造财富的动力,还会致使互联网本身停转。自由流动的复制品已经在互联网这个全球通信系统的本质中留下了烙印。网络技术需要没有约束的复制。复制品必然流动。
我们文明早先的经济,建立在堆满实体货品的仓库和工厂之上。这些实体库存仍然必要,但对于财富和幸福来说,只有它们已经不再足够。我们的注意力已经从实体货品的库存上,转移到了无形产品(例如复制品)的流动上。我们考察一样东西的价值,不再仅仅针对它所包含的原子。这件东西的非物质成分、设计,甚至是它根据我们的需求灵活变化的能力,也都会成为衡量价值的因素。
曾经用钢铁和皮革制造出的实体产品,如今已被当作不断更新的流动服务来出售。马路上停泊的实体汽车,已经转变成了由优步、lyft、zip和rideshare 、meerkat [17] 、periscope [18] 等许多其他社交媒体都能让你实时在朋友圈里,甚至对朋友的朋友分享视频和音频。能够迅速为音乐转调、修改歌曲、用算法创作音乐,好让你实时分享出去的工具并不遥远。个性化音乐,即用户产生的音乐,会变得稀疏平常。而在实际上,个性化音乐将会在每年创作出来的音乐里占到大头。因为音乐是流动的,它会扩张。
就像我们已经从其他艺术的逐步民主化中了解到的那样,很快你就可以不以音乐家的身份制作音乐了。100年前,拥有拍摄照片的技术能力的人们,只是一小群专注的实验者。在当时,拍摄照片的一系列流程复杂和繁琐到让人难以置信。在把一张照片“伺候”到能看的程度之前,你要有丰富的技术技巧和极大的耐心。一个摄影专家每年产出的照片,或许只有十几张。而在今天,所有人都有手机,而只要有手机,任何人都可以立刻拍出比100年前职业摄影师平均水平好上100倍的照片。我们都成了摄影师。同样地,排版曾经是门手艺。一个排字工需要多年的经验,才能把书页上的字体排印得既赏心悦目,又清晰可读。这是因为当时还没有所见即所得技术。而当时知道字间距是什么东西的人,或许只有1000个。今天,字间距已经成了小学课本里的内容,即便是新手都能利用数字工具排出的版面,要远远胜过以前平均水平排字工的成果。制图也是如此。随便一个网络潮人都能比过去最好的制图员做出更好的地图。所以,音乐也会变成这样。在新工具加速比特和副本的液态流动下,我们都会成为音乐家。
音乐如此,其他媒介也会如此。音乐产业如此,其他产业也会如此。
电影也步入了音乐的后尘。曾经,电影是个罕见的东西,位列制作成本高昂的产品之一。即便是一部b级片 [19] ,也需要一群高薪的专业人士才能制作。昂贵的投影设备需要看护,所以看场电影,就变成了既麻烦又稀少的事情。随后,就是和文件分享网络一同出现的视频摄像机,而你也可以随时观看任何影片了。成千上万的人变成了电影系学生,开始制作自己的视频,并上传到youtube,使其成为数十亿作品中的一员。受众金字塔再一次翻转。我们现在都是电影制作者了。
从一成不变到流动的巨大变动,可以从书籍的地位中鲜明地体现出来。最初,书籍是具有权威性的固定著作。在作者和编辑的精心雕琢下,它们可以在一代又一代人中传承下去。一本大部头的纸书在本质上是十分稳定的。它被安放在书架上,不会移动,不会变化,或许会以会这个姿态保持上千年。图书评论家尼克·卡尔(nick carr) [20] 同时也是个爱书之人,他可以罗列出书籍的4种一成不变的体征。我转述如下:
书页是一成不变的——书的每一页会保持不变。无论什么时候,翻开到一本书的固定一页,它都是不变的。这让人感到十分可靠。也就是说,无论参考还是引述,书中某一页的内容都会是一模一样的。
版本是一成不变的——无论你手里拿起的书是哪一本,也无论你在任何地方,任何时间购买到了这本书。只要是同一个版本,它们就不会有所不同,所以我们才能分享其中的文字,讨论一本书的内容,而不用担心我们看到的东西是否不同。
介质是一成不变的——爱护得当的话,一本书可以保存很长时间(比数字格式多保存几个世纪),而书中的文字不会因为年久发生改变。
完成度是一成不变的——一本纸书同时意味着盖棺定论。书中的内容已经终结,是已经完成的东西。以印刷品出现的文学,部分魅力就在于它把自身交付给了纸张,几乎如同誓言一般。而作者的威望,就建立在此之上。
上述4点都是非常吸引人的特性。它们使得书籍历久弥新,使书籍成为了需要严肃对待的东西。然而任何一个喜爱纸书的人都意识到,印刷出版的书本会越来越少;而想象一个仅有少数新书付印的时代并不困难。今天,图书主要以电子书的形态问世。即便是旧本藏书,其文字也会被扫描注入到互联网的任何角落里,进而在互联网的超导线路中自由地流动。电子书,至少是我们今天看到的电子书,并不会出现上述4种一成不变的情况。但爱书之人怀念那些一成不变时,我们应当意识到,电子书具有4种流动性,分别对应纸书的4种一成不变:
书页是流动的——页面成了一种灵活的单位。从智能眼镜上那微乎其微的屏幕,到一整面墙,内容会流动适应任何可用的空间,它可以适配你喜爱的阅读设备和阅读风格。书页以你为主。
版本是流动的——电子书的材料可以变得个性化。如果你是学生,那么你手中的版本或许会解释生词。如果你在阅读一个系列的丛书,那么这本书可以省略掉前情提要,因为你已经读过之前的那一本了。个性化的“我的图书”会在真正意义上为我量身打造。
介质是流动的——电子书在云端保存的成本是如此之低,以至于在没有限制的图书馆里保存一本书的费用是“免费”的。而且这本书还能再瞬时间发往地球上的任何地方,无论发送时间如何,接受对象是谁。
改进是流动的——电子书的内容可以随时更正,也可以逐步改进。和一块毫无生气的石头相比,永无更新止境的电子书(至少在理想状态下)更像是一种动物。而这种生机勃勃的流动性也鼓舞我们成为了创造者和读者。
在这个时代主流科技的驱动下,我们看到了两种完全相反的特性:一成不变和流动不息。纸张倾向于一成不变,电子倾向于流动不息。但没有任何事情可以阻止我们发明出第三种特性——把电子融合进入纸张,或者融合进入任何一种材料里(想象一本书中的每一页,都是柔软的数字屏幕)。几乎任何实体物品都可以增加少许的流动性,而任何一种流态的事物都可以融入到实体事物中去。
在音乐、书籍和电影身上发生的,正在游戏、报纸和教育中发生。这一模式,会延伸到运输、农业和医疗健康领域。车辆、土地和药品这样一成不变的东西将会变得流动起来。拖拉机会变成配备了轮胎的快速运转的电脑块;土地会变成网络传感器的基板;而药品会变成可以从病人那里传回信息给医生的分子信息胶囊。
以下就是流动的4个阶段:
固定、罕见。最开始的情况,是耗费了大量专业经验创造出来的宝贵产品。这些产品,每一个都如同艺术品一般,完成度高,盈盈独立,通常以高质量产品的形式出售,如此才能补偿创造者付出的艰辛。
免费、无所不在。最早的破坏来自于对第一阶段产品的杂乱复制,其量级之大,使得产品变成了日用品。廉价、完美的复制品近乎免费,哪里有需求,就会在哪里开枝散叶。复制品的过度散播会破坏掉既有的经济。
流动、分享。第二阶段的破坏是对产品的解构,产品拆散后的每一个原件,都会流动寻找新的用途,并和新的产品绑定在一起。第一阶段的产品现在成为了服务信息流。它分享自云端,变成了财富和创新的平台。
开放、变化。前两个阶段引发了第三阶段的解构。强大的服务信息流和既有的“原材料”顺手把成本降低到了一点点,使得业余者只需要很少的专业技能就能创造出新产品和全新品类的产品。创造的地位发生了转变,受众因而成为了艺术家。输出、选择和质量都会突飞猛进。
以上4个流动的阶段适用于所有媒介。然而一成不变并未消亡。我们文明中大部分优秀的固定事物(例如道路、摩天大楼)不会走掉。我们会继续制造模拟介质(analog objects)的物品(椅子、盘子、鞋),但它们会吸纳数字特性,同时嵌入芯片(除了那些数量极少但又具有超高价值的史前手工制品)。流体信息流的百花齐放不是做减法,而是做加法的过程。旧的媒介形态延续,新的媒介形态会覆盖其上。最重要的不同在于,一成不变不再是唯一的选项了。好东西不一定是静态不变的。换句话说,正确的不稳定现在成了好事。从停滞到流动,从一成不变到奔流不息,期间的变化并不意味着要放弃稳定性。这是一场对广阔边界的开垦,许多建立在可变性基础上的额外选项都会成为可能。我们正在进行方方面面的探索,从而可以在无止的变化和形态变换的过程里,制造出东西来。
以下是不久将来中一天的生活:我点击登陆云端,进入包含了所有音乐、电影、图书、虚拟现实世界和游戏的资料库。我选择了一首歌。除了音乐之外,我还能得到这首歌的所有部分,细致到每一个和弦。这首歌的素材被分配到了不同的音轨中,也就是说,我可以只获得贝司或者鼓点的音轨,也可以只留下人声,还可以得到没有人声的音乐——用来唱卡拉ok再合适不过了。我可以通过各种各样的工具,在不影响音高和旋律的情况下延长、缩短乐曲的时长。更加专业的工具还能让我换掉歌曲里的某件乐器。我喜爱的音乐家中,有一位发布了她歌曲的另类版本(需要额外收费),此外,她甚至还提供了她创作过程中尝试的所有历史版本。
电影的情况类似。除了配乐,无数电影的桥段也会单独发布。我可以得到声音效果、每个场景(之前或者之后)添加的特效、各种镜头视角,旁白。而这些素材都是可以直接拿来使用的。有些工作室还会发布一整套可以重新编辑的花絮片段。利用如此丰富的素材,业余剪辑师会重新剪辑已经发布后的影片,并期望能够做出比原导演更好的的版本。这已经成为了一种亚文化。我就在我的媒体课程里东拼西凑地做了一点出来。当然,并非所有的导演都会对有人改编自己的作品感兴趣,但这种需求如此庞大,那些内部素材的销量如此之高,以至于一些工作室会以此为生。成人分级的电影可以被改编成老幼皆宜的家庭版本。或者在暗网 [21] 中,g级影片 [22] 也可以制作出非法的色情版本。在成千上万部已经发行的纪录片里,有许多还会根据观众、爱好者和导演添加进来的素材保持更新,继续讲述没讲完的故事。
我自己的移动设备可以制作、分享视频信息流。这些信息流生来就分好了频段,可以轻易被我的朋友们改造加工。他们可以选择背景,把我的朋友们放到异域风情的场景中,并且用一种绝佳的方式诙谐地调节氛围。每一段上传的视频都需要用另外一段基于它制作的视频回复。而无论从朋友还是从专业人士那里,人们收到一段视频、一首歌、一段文本后的自然反应,不再会是对其加以消费,而是对其加以改造。人们会对通过增减、评论、修改、变形、合并和翻译,把内容提升到新的高度。人们会继续让内容流动,会把流动的效果最大化。我对媒体的畅想,或许是充满了碎片的信息流,其中一些被我用来消费,而对于大部分媒介,我都会在某种程度上参与进去。
我们刚刚开始流动。对于某些种类的数字媒体来说,我们已经开始进入第四个阶段,但对于大部分媒体来说,我们还停留在第一个阶段。我们的日常生活和基础设施,还有很多有待液化,但它们终归会变成流动的信息流。稳定朝着减物质化和去中心化的巨大转变,意味着进一步的流动将会是必然。我们的制造环境中,大部分固化而且固定的器械将会转变成飘渺的力量,这在现在似乎成为了一项延伸出来的权利。但柔会克刚。知识将支配原子。原生的无形自唱将会在免费的基础上建立起来。现在,请畅想这个世界正在流动。
[1] 均为美国流行的共享用车公司,可参考国内的滴滴快的。——译者注
[2] 加拿大著名哲学家及教育家,是现代传播理论的奠基者。——译者注
[3] 均是著名的网络聊天应用,前者可以自动删除聊天记录,后者可以通过技术手段防止聊天信息被他人监听。——译者注
[4] 美国网络支付服务,square用户可通过连接智能手机的刷卡器进行刷卡支付。paypal是第三方网络支付平台,支付宝的基础功能与之类似。apple pay是苹果通过iphone提供的手机支付功能。——译者注
[5] 第一个广泛应用p2p下载技术的音乐共享服务。1999年,唱片公司曾以侵犯版权为由对其发起诉讼。——译者注
[6] 同中国图书的发行习惯不同,欧美国家的图书往往最先发布价格较高的精装版本,等到一段时间后,才会发行价格较便宜的平装版本。——译者注
[7] 是美国一家以开发、贩售linux包并提供技术服务为业务内容的企业,其著名的产品为red hat enterprise linux。——译者注
[8] apache软件基金会(apache software foundation,简称为asf),是专门为支持开源软件项目而办的一个非营利性组织。在它所支持的apache项目与子项目中,所发行的软件产品都遵循apache许可证(apache license)。——译者注
[9] 此处“自由自在”对应的原文是“free”,同时有“免费”和“自由”的含义。——译者注
[10] 20世纪60年代成立的美国摇滚乐队,《滚石》杂志将其列为“史上最伟大的艺人”第57位。——译者注
[11] itunes商店是苹果公司2003年推出的数字媒体网络商店,最初在线出售数字格式音乐,2008年4月成为美国最受欢迎的音乐经销商。——译者注
[12] 包括真实的乐器、真实的演奏者和现场观众。——编者注
[13] 电台司令乐队2007年发布《in rainbows》专辑时决定采用免费增值模式,即听众可以从乐队官网上下载到普通质量的mp3文件,付费用户则可以获得音质更好的cd唱片和黑胶唱片。——译者注
[14] 起源于瑞典的音乐流媒体服务,提供包括sony、emi、warner music group和universal四大唱片公司和众多独立厂牌在内的、由数字版权管理的音乐。是目前全世界最大的流媒体音乐服务商。——译者注
[15] 在线音乐分享平台,允许人们合作、交流和分享原创音乐录音,总部位于德国柏林。——译者注
[16] 推特旗下的免费移动应用,允许用户创建最长6秒的短片并分享到到推特、脸谱网等社交网络。——译者注
[17] 美国流行的流媒体直播应用,允许用户通过手机向关注用户进行直播。——译者注
[18] 推特旗下的流媒体直播应用。——译者注
[19] 拍摄时间短暂且低制作预算的影片,所以普遍布景简陋、道具粗糙,影片常缺乏质感,剧情也趋于公式化,没有良好的品质。——译者注
[20] 全称尼古拉斯·g·卡尔(nichs g. carr),美国科技、商业领域作家。2011年获普利策非虚构类作品奖。——译者注
[21] 指只使用非常规协议和端口以及可信节点进行连接的私有网络。暗网的数据传输是匿名进行的,因此被大量用于非法交易。——译者注
[22] 根据美国电影协会制定的电影分级制度,g级影片意为所有年龄皆可观赏,影片不含或仅含少量家长认为不适合儿童观看的内容。——译者注
第4章 屏读 screening
在古代,文化都是围绕着言语的。记忆、念诵与修辞的语言技巧向这些依凭口口相传的社会注入对于过去、对于模棱两可、对于华美言辞、对于主观认知的崇敬之情。我们曾经是言语之民(people of the word)。大约500年前,科技推翻了言语。1440年,古登堡发明了金属制成的活字,将写作提升到了文化的中心位置。印刷文本意味着廉价却完美的副本,成为变化的引擎和稳定的基础,新闻、科学、数学公式和法律法规无一不从印刷中诞生。印刷向社会灌注的,是对(白纸黑字式的)精准的崇敬,是对(字据为证的)客观的追求,是对(通过作者树立的)权威的拥护 [1] 。真相都在书中固化终结。
大规模生产的图书改变了人们的思考方式。印刷技术扩展了既有的文字量。古英语中大致拥有的5万个词汇如今已经膨胀到了100万个。词汇选择方式越多,沟通就越丰富。媒介的选择方式越多,写作的主题就越宽阔。作者不一定只能撰写学术巨著,还可以“浪费”那些不值钱的印刷书籍来创作些让人撕心裂肺的爱情小说(最早的浪漫小说发端于1740年)。哪怕作者不是国王,也可以出版些回忆录。人们可以写下反对主流舆论的小册子,而在廉价的印刷技术帮助下,非正统的理念或许也能产生推翻国王或者教皇的影响力。作者具有的权力曾经一度催生出对作者以及作者拥有的权威的崇敬,并且哺育出了专家文化。完美“由书籍”而成就。官方把法律编纂成册,写就的合同如不使用书中的语言便不会有效。印刷、音乐、建筑、舞蹈都很重要,但西方文化的核心却是书中那一张张可以翻动的书页。到1910年,居民超过2500人的美国城镇中,有四分之三拥有公共图书馆。而美国的根基更是从文件中萌发出来的:无论是美国宪法、独立宣言,还是影响不那么直接的《圣经》。美国的成功依赖于较高水平的识字率,依赖于强大的自由媒体,依赖于对(书面规定的)法律的忠诚,依赖于遍布全国的通用语言。我们变成了书籍之民(people of the book)。
但今天,超过50亿张的数字屏幕在我们的生活中闪烁。数字显示器制造厂商还会每年生产出来38亿个新屏幕。这几乎相当于地球上的每个人每年都会得到一个新屏幕。我们会在所有平整的表面上装设显示屏。文字已经从纸浆里转移到了电脑、手机、游戏机、电视、电子显示屏和平板电脑的像素当中。字母不再白纸黑字地固定在纸上,而是在玻璃平面上以彩虹样的色彩,于眨眼间飞速来去。屏幕占据了我们的口袋、行李箱、仪表盘、客厅墙壁和建筑物的四壁。我们工作时,它们就在我们面前安坐,无论我们做的是什么样的事情。我们现在成为了屏幕之民(people of screen)。
这在当下的文化中埋下了书籍之民与屏幕之民冲突的种子。今天的书籍之民善良勤奋,他们撰写报纸,编纂杂志,起草法律条文和办公室规定,为金融秩序定下规矩。他们通过书籍,通过作者散发出的权威气息生活。这种文化的根基完完全全地安置在了文本当中。可以这么说,他们全都位于同一张书页上。
书籍浩瀚无边的文化力量,源自于再生产的机器。印刷出版社快速、廉价、准确地复制了书籍。即便是一个屠夫,都可能有本《欧氏几何》或者《圣经》。印刷副本就是这样超越阶层,点亮了公民的思想。艺术和音乐领域中也出现了具有类似变革性的再生产机器,激发出的效果与书籍相当。廉价复制的图表加速了科学发展。不再昂贵的照片拷贝和音乐副本最终把书籍的再生产规则发扬光大。我们快速制造廉价艺术和音乐的时间,就像印刷图书一样迅速。
至少从20世纪开始,再生产文化就已经浇灌出了人类成就史上最美丽的花朵,创造出了创意作品前所未有的黄金时代。廉价的实体复制品已经让数百万人向自己的受众直接出售作品来赚取生活费,而不必再去接受各种古怪的赞助。从这种模式中获益的不仅仅是作者和艺术家,还有受众:几十亿普通人第一次能在日常生活中接触到优秀作品。在贝多芬的时代,他的交响乐很少有人能听过一遍以上。而随着廉价录音的出现,爪哇岛上的理发师都能整天整天地听音乐了。
但是今天,我们中的大部分人都变成了屏幕之民。屏幕之民倾向于忽略书籍中的经典逻辑,和对书本的崇敬。他们更喜欢像素间的动态流动。他们会被电影银幕、电视屏幕、电脑屏幕、iphone屏幕、虚拟现实眼睛屏幕、平板电脑屏幕,以及在不远的将来嵌在所有平面上的大量数字屏幕所吸引。屏幕文化是一个不断变动的世界,充满其中的是无穷无尽的新闻素材、剪辑资料和未成熟的理念。这是一条由微博、摘要、随手拍照片、简短文字和漂浮的第一印象构成的河流。其中的观念并不突出,却和方方面面交缠连结在一起。在这里,真相并非来自权威,而是由受众自己一个碎片一个碎片实时拼接出来的。屏幕之民创造他们的内容,构建他们自己的真相。和流动的入口相比,一成不变的书本不再重要。文化变得快速、流动和开放。快速得就像30秒钟的电影预告片,流动、开放得就像是维基百科上的词条页面。
屏幕上的文字会变,会融入图片,会变幻色彩,甚至还会改变含义。有时候,屏幕上根本没有字,只有能引申多种含义的照片、图表和符号。许多以文本为基础的文明对这种流动性大为恐慌。在这个新的世界里,快速变化的代码(就像是不断升级的电脑代码)比固定的律法更加重要。呈现在屏幕上的代码可以不断地逼用户修改,而印制在书本中的律法却不能这样。然而代码塑造行为的能力和律法几乎一样,甚至更大。若想通过屏幕改变人们在网上的行为,只要改变管理这个地方的算法即可。算法可以监督集体行为,也可以把人们引向其所偏好的方向。
书籍之民喜欢律法提供的解决方案,而屏幕之民则把技术看作是解决一切问题的灵丹妙药。真相在于,我们都处在变革当中,而在我们之间发生的书籍文化和屏幕文化的冲突,在个体的身上也会发生。如果你接受过现代教育,那你没准就会被这两种模式困扰。这种紧张是新的常态,起源于50年前入侵我们客厅的第一块屏幕,起源于电视机那笨重宽大、热气腾腾的显像管屏幕。屏幕“祭坛”越大,我们花在阅读上的时间就越少。这一趋势延伸了下去,以至于在其后的几十年里,阅读和写作似乎即将终结了一样。教育者、知识分子和政客们在过去半个世纪里忧心忡忡,担心电视一代丧失掉写作技能。人们把一系列社会病症归结在屏幕上,而这张病症清单长度惊人。不过可以肯定,我们还在观看屏幕,而且有那么一段时间看上去确实像是没有任何人写作,或者没人能写作了。而阅读测试分数也是在几十年里连年下降。但让所有人都吃惊的是,在21世纪初,显示器上那些互相连接的炫酷超薄屏幕,还有新式的电视和平板电脑引起了写作的热潮,而这股热潮持续至今,仍没有消散。人们花在阅读上的时间差不多是20世纪80年代时的三倍。到2015年,万维网上的页面数量超过了60万亿个,而这个数字还在以每天几十亿个的速度增长。这些网页中,每一个网页都要人来写就。就在现在,普通民众每天能发布8000万条博客。书写工具也从笔变成了手机。全世界的年轻人每天能用手机写下5亿条段子,无论他们正在求学,还是已经工作。屏幕数量的增长在继续扩展人们的阅读量和写作量。美国的识字率在过去20年中一直保持不变,但那些有阅读能力的人却比以前读得更多,也写得更多。如果我们对所有屏幕上创作出的所有文字加以统计的话,我们就会发现,你每周写下的文字比你的祖母要多,无论你住在什么地方。
除了一行一行地阅读文字之外,我们现在还会阅读音乐电视那跳动无规律的歌词,也会阅读电影结束后快速上滚消失掉的职员表。我们能阅读虚拟现实化身说出的对话气泡,也会点击视频游戏里的物品标签,还会解读在线图标中的文字。“屏读”(screening)或许是这种行为更合适的名称,而不是阅读。屏读包括阅读文字,但还包括观赏文字、阅读图像。这种新行为拥有新的特征。屏幕不用关闭,我们的视线永不离开。这就和书籍不一样。这种新的平台非常视觉化,而且会逐渐把文字和变化的图像融合在一起。文字在屏幕上无处不在,它们会浮动在图像之上,也会充当注释和注脚,还会连接到其他文字或图像。你或许会觉得,这种新媒介就像是我们用来观赏的图书,或者像是用来阅读的电视。
尽管文字重新回到了我们的视野,但书籍之民却有理由担心,书籍和因此产生的经典阅读与写作,作为一种文化形式,会很快消亡。如果这种消亡成为现实,谁还会追随阅读书籍所鼓励的线性推理?如果对于法律文典的尊重,转而被试图控制我们行为的一行行代码所取代,谁还会遵纪守法?如果屏幕上闪烁的所有东西都几乎免费的话,谁还会付钱给作者?或许到那时,只有富人才会阅读纸张做成的书籍,只有少数人才会留心那些书页中的智慧,只有少数人才会为此付费。书籍为我们文化带来的稳定会被什么东西替代?我们会不会直接抛弃掉构筑现有文明的庞大文本基础?文学、理性思维、科学、公平、法律法规——这些现代文明中被我们所珍爱的事物,无一不创造自旧的阅读方法,而新的方法与此无关。那么在屏读到来之后,它们会变成什么样子?书籍的未来又会是怎样的?
书籍的命运值得仔细研究,因为在屏读将会转变的众多媒介中,书籍是第一个。屏读首先会改变书籍,然后会改变图书馆;之后,它会给电影和视频动手术;再之后,它会瓦解掉游戏和教育;而最终,屏读将会改变每件事。
书籍之民认为,他们理解书籍的本质:书是书页装订在一起的集合,它们会有一条书脊,好让你握在手里。过去,在封面和封底之间无论加入了什么东西,都可以用书籍的量词“本”来称呼。我们会把电话号码清单叫做“一本电话簿”,尽管“这本书”在逻辑上,并没有开端、中间和结束。一堆空白页面装订在一起,是“一本素描册”。这种空无一物的东西实在有些不害臊,但它确实有封面和封底,因此可以用“本”来计量。在一排页面中印刷上各式各样的图片,就成了“一本画册”,哪怕这“本”东西里一个字都没有 [2] 。
今天,书籍中的纸页正在消失,留下的只是书籍的结构性概念——根据一个主题串联起一堆符号,要花上一段时间才能读完。
既然书籍的传统外壳已经消失,那么怀疑书籍的组织形式是否已经成为老古董,就是很正常的事了。与现在出现的许多其他文本形式相比,书中的无形容器能否具有某种更强的优势呢?
有文学学者声称,在阅读的时候,书就真正成为了你思绪神游的虚拟空间。而有人管这种充满想象的概念状态叫做“文学空间”。这些学者认为,当你进入这种阅读空间之后,大脑的工作方式就会变得和“屏读”完全不同。神经学研究显示,学习阅读会改变脑神经回路。和跳过那些让人心烦的繁杂信息不同,你会变得情不自禁、专心致志、沉浸其中。
有人可以花上好几个小时来阅读网络上的文字,但从来不会进入到这种文学空间里,得到的反而只有碎片、线索和印象。网络最大的吸引力就在于此:五花八门的碎片化信息以松散的方式聚集在一起。但如果缺少某种牵制的话,这些松散聚集在一起的碎片化信息就会把人搞得晕头转向,把读者的注意力带离核心,在中心论述和观点之外的地方游荡。
一个分离出来的阅读设备或许能够带来帮助。到目前为止,我们已经有了平板电脑、电子书和手机。其中手机最让人吃惊。长久以来,专家一致保持着这样一种观点:没人想在巴掌大的小屏幕上阅读。但他们错了,而且错的十万八千里。我和很多人都喜欢用这种方式来读书。实际上,我们还不知道可以读书的屏幕到底可以做到多小。有一种实验性质的阅读方式,被称为“快速连续视觉展示”(rapid serial visual presentation)。这种阅读方式使用的屏幕,宽度和一个字相当,大小就像一枚邮票一样。阅读的时候,你的眼球会保持不动,固定在单个的字上。而屏幕上的单字会一个接一个地变化成为文本中的下一个字。这样一来,你眼里看到的便是一个个单字“排在后面”组成的文字序列,而不是一行行冗长的文字。只有一个字宽的小屏幕几乎可以塞进任何地方,扩大我们可以进行阅读的地点。
kindle和类似的电子墨水电纸书的销量,已经超过了3600万个。而这些电子书的模样,是一块能显示出单页内容的板子。点击板子,就能“翻页”。而所谓的“翻页”,其实是屏幕上的内容消失变成了另一页的东西。和纸书中使用的传统墨水相比,最近几代kindle使用的反射式电子墨水一样能够显示出既锐利又易读的文字。然而这些电子书和印刷书籍不一样的地方在于,用电子书时,你可以从页面里复制、粘贴文本,可以顺着超链接了解更多内容,还可以和插图互动。
但是一本电子书并不是非要做成一块板子不可。人们可以用电子墨水做成像纸张一样既便宜,又柔软,又轻薄的电子纸。人们还可以把100张左右的电子纸装订在一起,加上书脊,把它们安插在漂亮的封面和封底之间。这样一来,电子书看上去就非常像是以前那些厚重的纸书了。不过这种电子书可以改变内容。就在一分钟前,书页上显示的还是一首诗,而在下一分钟,这页“纸”就变成了一张收条。然而你还可以翻动那些薄薄的书页(这种导航文本的方式很改进)。你阅读完一本书之后,可以拍打书脊,然后它就变成了一本完全不同的书。它不再是一本畅销的神秘小说,而是变成了教你如何养殖水母的指导手册。这种人工制品会被精心打造,握在手里也能带来满足。一本设计精良的电子书带给的感觉非常之好,以至于值得你为其购买一个覆有摩洛哥软牛皮的封面,制成适合你双手的样子,并引得你抚弄这些最轻薄、最光滑的页面。你或许还会拥有好几个电子书阅读器,它们都为不同内容做过优化,大小不同,形状不一。
个人来讲,我喜欢我的藏书中那些宽大的书页。我希望能有这样一个电子书阅读器:它可以折叠,很像日本的纸艺,展开之后,就有今天一张报纸的大小;或许页面数量也和今天的报纸一样。读完内容之后,我并不介意花上几分钟的时间把它叠成口袋大小。我喜欢一眼扫过好几个长篇专栏,也喜欢在同一个版面上的不同标题间挑挑拣拣。有几家研究实验室正在实验一种书的原型,它可以通过便携设备上的激光把内容又宽又大地投影到附近的平面上。一张桌子、一面墙,都能变成这种书籍中的页面,通过手势翻动。这种超大型号的页面能让你的眼球在不同的栏目间漫游,能让人产生怀旧时才有的那种激动。
数字图书的直接效果,是可以在任何时间呈现在任何屏幕上。书将会变得呼之即来。在你需要读书之前,就购买和囤积书籍的行为会消失。书不再像是一种人工制品,而更像是映入你视野的信息流。
这种液态性不只是书籍制作所面对的现实,对于消耗品来说也是如此。试想一下,无论在哪个阶段,一本书都成为了一种流程,而非制品。“书”这个字不再是名词,而成了动词。书的含义会更多地向“订购”倾斜,而非纸张或者文本 [3] 。书是一种变化,是思考、写作、研究、编辑、改变、分享、社交、知化、组合、营销、进一步分享、屏读等动作的持续流动。而这种流动产生出来的书籍,又会随着时间不断变化。书籍,特别是电子书,会成为“订购”流程的副产品。屏幕上显示出的书籍,变成由订制字词和想法产生出的关系网络。它能将读者、作者、角色、想法、事实、概念和故事连接起来。而这些关系经由屏读的新方式,不断地扩大、加强、拓宽、加速、改变、重新定义。
然而,书和屏幕之间的关系仍然紧张,不时擦枪走火。目前,亚马逊、谷歌等提供屏读内容的公司,仍在遵循纽约出版商制定的规则,等待部分畅销书作者的许可。这些电子书的监管者已经同意在当前,通过一系列方法削弱电子书的极端流动性。这些方法包括:防止读者接触容易复制粘贴的文本,禁止读者复制一本书中的大量段落,以及其他严肃处理文本的行为。
维基百科是屏读的原始文本,它所具有的可替代性,是今天的电子书所缺乏的。但电子书的文本会逐渐得到解放,而书籍的真实特性将会绽放出来。我们会发现,书籍其实从来不想被印刷成电话号码簿,也不想被印在纸上做成五金商品目录,更不想成为纸质版的说明手册。对于这些工作,可以升级与搜索的屏幕和比特比起纸张来具有太多优势。被人批注、标注、标记、收藏、总结、参考、链接、分享、传播,才是这种书籍长久以来真正想要的。数字化能让这些书籍实现“夙愿”,而且做到的还能比“夙愿”更多。
在kindle设备中,我们已经能够看到书籍获得新自由的些许火花。在我阅读一本书时,我可以把我希望记住的段落重点标注出来(尽管还是有些麻烦)。我还能把这些重点标注的段落提取出来(今天需要费些功夫),并且选出最重要、最需要记住的部分重新阅读。更重要的是,只要我允许,我标注出的重点就可以分享给其他读者,而我也可以读到他们标出的重点。我们甚至还能从所有读者标注的重点里,过滤出最受欢迎的那些,然后通过这种方式,开始以一种全新的方式阅读书籍。我还能阅读某个特定朋友、学者或是评论家的标注。这让更广泛的受众群体能够访问另外一位作者深入阅读一本书籍时做下的珍贵旁注(前提是得到他们的允许)。以前,只有珍本书籍的收藏者才能有幸见证到这种福利。
阅读变得社交化。通过屏幕,我们能够分享的,不再只是我们正在阅读的书名,还有我们的反应,以及读书时做下的笔记。今天,我们可以重点标注段落,明天,我们就能把这些段落链接起来。我们可以在我们正在阅读的书里,选出一个词语,加上链接,导向另一本我们已经读过的书中的一个词来对比,也可以从一段话里选出一个字,链接到一本晦涩的字典里。我们还可以从一本书里选出一个场景,链接到某部电影里的相似场景。(做到以上这些,需要能够找到相关内容的工具。)我们或许可以从我们尊敬的人那里订阅他们做下的旁注,如此一来,我们得到的就不只是他们的读书笔记,还有他们做下的旁注——他们标出的重点、他们写下的笔记、他们发出的疑问、他们获得的灵感。
图书分享网站goodreads [4] 上,正在发生这种智能化的读书俱乐部讨论。而这种讨论或许会伴随书籍本身,并且会通过超链接更加深入地融合到书籍里面去。所以,每当有人引述了一段特殊的段落时,评论和段落之间就会建立起一个双向的链接。即便是最微小的善举,都能汇聚起一套维基 [5] 一样的评论,这些评论会紧密地和实际文本绑定在一起。
实际上,密布在书籍中的超链接,会把所有书籍变成一个网络化的事件。关于书籍的未来,传统观点认为书仍将会是孤立存在的物品,每本之间相互独立,就像它们摆在公共图书馆书架上的样子一样。在这种情形下,每本书都不会意识到相邻的那本。一旦作者完成一部作品,这本书就是一成不变,已经完成的了。只有读者拾起这本书,用他/她的想象力让它变得生动起来时,这本书才会变得动态起来。在这种传统的观点里,未来的数字化图书馆,其主要优势是具有移动性——将一本书的全部文本转译成为比特,从而使人们可以通过屏幕在任何地方进行阅读。但这种观点忽视了由扫描书籍催生出的重大变革:在万能的图书馆(universal library)里,任何一本书都不会成为一座孤岛,它们全部都是相互关联的。
把墨水印刷出来的字转变成可以在屏幕上阅读的电子像素,只是创建这种全新图书馆的第一步。真正具有魔力的,将会是第二步行动,即每本书中的每一个字都被交叉链接、聚集、引述、提取、索引、分析、标注,并被编排进入文化之中,程度之深前所未有。在这个电子书和电子文本的新世界里,每一个比特都预示着另外一个比特,每一个页面都会读取其他页面。
关于互联,我们现在能做到最好的,是把部分文本与其来源的标题,以目录学或者注脚的方式链接起来。如果能在一本著作里,把一段特定段落和另外一段链接起来的话自然更好,但以目前的技术水平来看,还是不可能的事情。不过,当我们可以深入地以句为单位链接起文件,并能让它们成为双向链接的时候,我们就会拥有网络化的书籍了。
你可以通过访问维基百科来试想这是怎样的一种场景。请把维基百科想象成一本非常庞大的书(维基百科当然是),想象成单独一本的百科全书。这本百科全书的3400万个页面里,大部分都充满了标注下划线的蓝色字体,这些标注意味着这些词可以超链接到这本百科全书中其他词条的任意位置去。这种错综复杂的关系,恰恰是维基百科,还有网络巨大力量的来源。维基百科是第一本网络化的书籍。由于每一个论点都会被交叉参考,每一个维基百科的页面都会随着时间的发展,沉浸在蓝色链接的海洋当中。随着所有书都变得完全数字化,每一本书都会随着时间的发展,积累出数量相当的蓝色下划线段落,因为每一处文字上的引用,都会在书里和书外建立起网络。书中的每一页都会发现其他页面,都会发现其他书籍。如此一来,书籍便会从它们的约束中抽身出来,并将它们自身编织在一起,成为一本巨大的元书籍(meta-book),成为万能的图书馆。这种以生物神经方式连接起来的集体智能,能让我们看到从单独、孤立的书中看不到的东西。
万能图书馆的梦想早已有之:在同一个地方,拥有所有知识,无论是当下的还是过去。以各种语言写就的所有书籍、所有文件、所有概念作品,都互相关联。这种愿望似曾相识,部分原因是在很久以前,我们就简单修建过这样一座图书馆:公元前300年左右建成的亚历山大图书馆,其设计目的便是存放当时已知世界中所有流传的卷轴。曾几何时,这座图书馆存放了大约50万个卷轴,几乎是当时世界既有图书的30%到70%。但即便如此,在这座伟大的图书馆灰飞烟灭之前,知识可以存放在同一栋建筑里的时代就早已消逝了。从那时起,信息已经逐步扩大到了我们无法容纳它的地步。2000年来,万能图书馆,和隐身斗篷、反重力鞋和无纸化办公等人们长久以来的渴望一起,已经成为了一种神话般的梦想,不断向无限的未来中撤退。不过,我们对存放所有知识的伟大图书馆如此渴望,它能否真的成为我们看得见摸得着的现实呢?
正在备份整个互联网的档案保管员布鲁斯特·卡利(brewster kahle)认为,伟大的图书馆现在就能成为现实。“这是我们超过古希腊人的机会!”他称颂道,“不需要等到明天,用今天的科技,它就真的有可能成为现实。我们可以把所有的人类著作提供给世界上的所有人。它将会是一个永世难忘的成就,就像把人送到月球上去那样。”而且和仅限精英使用旧式图书馆不同,这种图书馆将会变成真正的民主化图书馆,其中的每一本书,都会以每一种语言提供给在这个行星上生活的每一个人。
理论上,在如此完整的一座图书馆里,我们应该能够阅读到所有报纸、杂志、期刊上发表的文章。从古至今所有艺术家创作出的画作、照片、电影和音乐,万能图书馆也都应该收录一份副本。而且,所有的广播、电视节目,也都应该收录其中。还有广告。当然,这座巨大的图书馆自然需要一份数十亿早已下线的网页,和现已消逝、以百亿计的博客博文的副本——它们是在我们的时代短暂存在过的文学。简单来说,人类有史以来的所有作品,无论语言,都应当在任何时间,向任何人开放。
这会是一座极其巨大的图书馆。从苏美尔人在泥板上写下楔形文字到现在,人类已经至少“出版”了3.1亿本书,14亿篇文章和论述,1.8亿首歌曲,3.5万亿幅图像,327514部电影,10亿个小时的视频、电视节目和短片,60万亿个公共网页。这些资料目前全部存放在世界各处的图书馆和档案馆中。它们全部数字化后,数据可以压缩存放到一个50pb大小的硬盘上(以目前的技术水平)。10年前,你需要一座小城镇图书馆大小的空间才能存储50pb的数据,而今天,这个万能的图书馆只要卧室大小就能填满。以明天的技术,它会全部塞进你的手机。到这一切发生时,收录所有图书馆的图书馆就会进入到你的钱包当中——前提是它不会通过细白的线缆直接接入你的大脑当中。部分生活在今天的人,完全有希望在有生之年看到这种事情发生。而其他人,大部分是年轻人,则想知道是什么东西让它拖了这么久才发生(我们能不能把它搞好,下个礼拜就运行起来?它们足以形成一个历史工程了)。
不过,能带给我们整个星球书写资料来源的科技,还会以同样的方式,转变我们今天称之为“书”的,以及存放书的图书馆的本质。万能的图书馆,以及它所收录的“书”,将会和今天我们已知的任何一座图书馆、任何一本书都不一样,因为我们不只会阅读这些书,我们还会以屏读的方式阅读它们。在维基百科取得大规模互联成功的支持下,许多技术宅相信,数十亿的读者可以可靠地将旧书籍中的书页编织在一起,依次建立起超链接。久而久之,那些对无名作家、珍品图书等特殊主题坏有激情的人,将会连接起这座图书馆最重要的部分。普普通通的慷慨之举乘以百万计的的读者,万能图书馆便会由此聚集起全面的内容。它们来自爱好者,面向爱好者。
除了能将字词、语句、书本精确联系起来的链接之外,读者还能添加标签(tag)。标签是公共记下的标注,就像关键词和分类名一样,依附在文件、页面、图片和歌曲之上。借助标签,任何人都能根据它来搜索文件。比方说,在照片分享网站flickr上,数以百计的观赏者会根据他们自己对照片认知产生的简单分类,为其他用户上传的照片加上标签:比如说“山羊”、“巴黎”、“笨蛋”、“海滩派对”,等等。推特上的标签则注明了微博内容的理念或主题。某人照片的标签或许会是主人在脸谱网上的名字。因为标签是在少量正式规则下,由用户以自由形式产生的内容,所以书籍世界接纳标签之后,书就会以更快的速度,更广的范围,和更优质的服务被分发出去,这比僵化难用的杜威十进制图书分类法 [6] (dewey decimal system)要好用得多,特别是在纳米科学或人体识别等前沿领域。基于人工智能的搜索技术取代了需要大量训练才能使用的分类系统。实际上,永远不会休息的人工智能,将会为文本和图像自动加上数以百万计的标签,如此一来,任何寻求智慧的人都能从万能图书馆中汲取养分。
链接和标签或许是过去50年里最重要的发明。在被编入文本的代码当之中时,它们就获得了第一股力量,但是它们真正的变革性能量,是普通用户在每天的网络浏览中通过点击释放出来的。用户没有意识到,每一个普普通通的点击,都是对一个链接的“投票”,这会提升它的相关登记。你或许认为你只是无意间瞅瞅这段文章,浏览下那个网页而已,但实际上,你正在用面包屑一般琐碎的注意力,匿名地构建出整个网络。这些兴趣的碎片被搜索引擎汇聚在一起,加以分析,从而强化了每一个链接的终点和每一个标签建立的联系之间的关系。这种智能自网络诞生以来,就在网络之中生根发芽,只不过对于书籍世界来说,此前一直犹如另一个国度一般。由于链接和标签,对万能图书馆进行屏读变得可能,而且威力巨大。
这种效应在科学领域显现得尤为明显。科学是一项长期的运动,它把世界上所有的知识编织成了一张由事实组成的网络。这张网巨大无垠,相互关联,富含各式注脚和同行审议。对于科学来说,独立事实的价值微乎其微,哪怕它在自己的世界中能讲得通。(实际上,伪科学和超科学就像是没有和科学这个巨大网络相连的小池塘。它们只在自己的网络里才有效。)在这种方式下,科学网络中新加入的所有新发现和新数据,都会提升其他数据观点的价值。
一旦一本书以这种连接方式被收录进方兴未艾的万能图书馆,它的文本就不再会独立于其他书籍中的文本。举例来说,今天一本严肃的非虚构著作通常会有书目,而且还会有某种类型的注脚。当书籍深度连接起来之后,你就能在任何书目或注脚里点击标题,寻找到注脚中标明的参考书籍。而在数目中列出的参考书籍,又会使它们自身变得唾手可得。如此一来,你就可以用我们在网页中通过链接跳转的方式,在图书馆的书籍中跳转,从一个注脚中发现另一个注脚,直到抵达事物最根本的核心为止。
接下来便是词语。就像一篇介绍珊瑚礁的网络文章一样,它会在部分词语上加入链接,导向对鱼类的介绍。数字化书籍当中的任何以及所有词语,都能用超链接的方式接入另一本书的其他部分。书籍,包括虚构作品在内,将会变成名字组成的网络,以及理念构成的群落。
在未来30年里,学者和爱好者们会借助计算机算法,将全部书籍编织成一个单一的文献网络。一个读者会贡献出一个理念的社会化图景、一项概念的时间线,以及对图书馆中任何观念具有影响力的网络地图。我们将会理解,没有任何著作,没有任何理念会是出类拔萃的。但所有优秀、真实和美丽的事物,都是互偶部分和相关实体组成的生态系统。
即便在书籍的核心特征变成了单一作者编写之后(对于大部分书来说这很有可能),书中网络化的补充参考、讨论、批评、书目和围绕一本书设置的超链接或许都将成为一种协作。缺乏这种网络的书籍,将会显得空无一物。
与此同时,书籍一旦数字化之后,就可以被拆分为单独的页面,甚至会被进一步解构成为页面中的片段。这些片段可以混合进入重新编排的书籍和虚拟书架当中。就像今天的音乐听众将歌曲改编、混缩进新的专辑或播放列表一样,万能图书馆也将鼓励读者创建虚拟“书架”——一种文本的集合,有的短小精悍,有的长篇累牍,从而形成一个关于某类特殊信息的图书馆“书架”。而且就像音乐播放列表一样,这些“书架”或者书籍组成的播放列表,一旦创建,就会面向普通大众公开和交换。实际上,部分作者将会开始撰写以片段方式阅读的书籍,还会创作能混合页面的著作。能够推动未来参考书(菜谱、手册、旅行指南)的,肯定是具有购买、阅读和复制单独页面或部分的能力。你或许会策划出你自己的“菜谱书架”,也可以通过许多不同的来源,编纂出一本卡津人 [7] 食谱汇编出来,其中包括网页、杂志、剪报和整本的卡津人菜谱。网络剪贴板网站pinterest允许人们创建出包含引述、图像、段子、照片的剪贴本。亚马逊最近向你提供了一个机会,让你公开自己的书架(亚马逊管它叫listmanias)——这是你标注出来的书单,其中都是你想推荐的某些冷门主题图书。而读者们已经在使用谷歌图书搜索来根据特定主题(比如所有关于瑞典桑拿浴的书籍,介绍钟表的经典作品等)组建迷你图书馆了。一旦书籍中的片段、文章和页面变得无处不在并且可以混合和传递,用户就会通过创建优秀的合集获得威望甚至收入。
图书馆(还有许多人)并不情愿放弃掉白纸黑字的老式书籍,因为印刷书籍是目前为止最长久、最可靠的长期存储技术。印刷而成的书籍并不需要通过中间设备阅读,因此对技术更迭带来的淘汰免疫。除此之外,和硬盘或者cd相比,纸张还非常稳定。忠于作者最初想象的、不会改变的版本排除了重混、编排的干扰,往往会成为最有价值的版本。如此一来,精装书稳定而不易改变的特性,便成了好事。它始终如一、忠实地反映着它的原始创作,却也孑然一身、孤立无助。
那么,当世界上所有书籍都由互联的词语和理念构成为一张流动的织物后,将会发生什么呢?会有以下四件事情发生:
第一,处在流行边缘的作品将会找到受众。虽然数量很少,但远比它们今天近乎为零的受众要多。发现一本用爱倾注而成的南印度牧师的素食食谱杰作,将会变得更容易。世界上大部分书籍的销量或者很低,或者为零,远在分布曲线的“长尾”之外。但在这里,数字化的相互链接会提升任何作品的读者数量,无论它有多么地晦涩难懂。
第二,随着文明进程中每一份原始文档都将被扫描并交叉链接,万能图书馆将增强我们对历史的理解。这些被收录的文档包括所有的黄色新闻小报 [8] 、未被使用的电话号码簿、落满灰尘的县志档案,以及封存在地下室中的老旧账簿。过去会更多地和今天相连,增进我们对今天的理解,和对过去的欣赏。
第三,收录所有书籍的万能图书馆,将会培育出新形式的权威。如果你能通过一个特殊的主题,将所有文本忠实地结合起来,无论古今,无论语言,那么你就会对我们文明的本质、人类物种的本质以及人类知识的范围和界限,有更清晰地视野。人类的共同无知所造就的空白空间将会突显,而人类知识巅峰的面貌将会更加完整。今天,只有少数学者达到了这种程度的成就并且成为权威,但它会变得司空见惯。
第四,也是最后一件事情,全面、完整,收录所有著作的万能图书馆会比只是改进搜索技术的图书馆变得更好。它会成为文化生活的平台,在某种程度上将书籍中的知识还原回到其核心。现在,如果你把google maps和monster [9] 混合起来,你就会得到一张张根据薪水标注工作地点的地图。以此类推,在这座巨大的图书馆里,人们很容易看到所有曾被描写过的事物。举例来说,当你通过类似谷歌眼镜 [10] 的可穿戴屏幕,“置身”伦敦的特拉法加广场 [11] 时,广场就会出现在你眼前。同样地,地球上的所有物体、事件和地点,都会“知道”曾在任何书中、以任何语言、在任何时间写下的任何事情。一种新的文化参与从这种深层次的知识结构中产生。你会全身心地与万能书籍展开互动。
不久,在收录一切的万能图书馆之外的书籍,就会变得像网络之外的网页一样苟延残喘。实际上,就书籍本质而言,在我们的文化中,维持书籍不断下降的权威性的唯一方法,就是将它们的文本接入到万能图书馆中。大部分新作品将以数字化的面貌问世,并且会流进万能图书馆。而你则或许会为一篇长篇小说加入更多文字。公共领域的模拟介质图书是一片广袤大陆,此外还有2500万著作是既没有印刷,也没有进入公共领域的孤本。它们最终会被扫描和连接。在书籍传统和屏幕协议之间的碰撞中,屏幕将会获胜。
网络化书籍的惊奇之处,是它们永远不会写完。或者说,它们不再是纪念碑,而是变成了文字的信息流。维基百科是编辑记录的信息流,任何尝试过引用它的人都能意识到这点。书籍不仅可以在时间上网络化,在空间上也可以。
但为什么还要自寻烦恼地管这些东西叫做书籍呢?根据定义,一本网络化的书籍,是没有中心的,并且到处都是边缘。万能图书馆的计量单位,会不会是句、段、章,而不是书呢?会的。但长篇巨制自有其力量。别出心裁的故事,一致的叙述方式,以及严谨的论述,总是强烈地吸引着我们。网络会被一种自然的共鸣吸引,围绕在其周围。虽然我们会将书籍解构,把组成它们的点点滴滴编织进入网络,但书籍更高层次的组织形式,将会专注于我们的注意力。它在我们的经济中,会保持稀缺状态。一本书,就是一种注意力单位。事实固然有趣,理念自然重要,但只有精彩的故事、精妙的论述、精心打造的叙述才会让人赞叹,永生难忘。就像穆里尔·鲁凯泽 [12] 所说的那样:“组成宇宙的是故事,而非原子。”
这些故事将会通过屏幕呈现出来。无论我们向哪里望去,都会看到屏幕。有一天,我在给汽车轮胎充气时看了一部电影中的些许片段。另一天晚上,我则在一架飞机的后座上看了部电影。而今天晚上的早些时候,我又在手机上看了部电影。我们在任何地点观看着屏幕。播放视频的屏幕会在最出乎意料的地方——例如在atm机上和超市结款台前,突然出现。这些不断出现的屏幕已经为极其短小、只有三分钟的电影创造出了受众,而廉价的数字创作工具则已经将新一代的电影制作者们武装起来,他们在迅速地为那些屏幕填充内容。我们正前往一个屏幕无处不在的时代。
屏幕需要的不只是你的目光。我们读书时,最常见的肢体动作是翻书和折页。但屏幕也能够吸引我们的身体。触摸屏会对手指的不断触摸做出反应。任天堂wii这种游戏机上的传感器 [13] 会追踪我们手与胳膊的动作。电子游戏屏幕的控制器会让手指快速颤动。而我们在虚拟现实头盔和眼镜中看到的最尖端的屏幕,则会引导我们全身运动起来。这些屏幕触发了互动,其中一些最新的屏幕(例如三星gxy手机上使用的那种)可以跟踪我们的眼球动作,预测我们将会看向哪里。屏幕将会知道我们在注意什么,注意了多长时间。智能软件现在也可以在我们阅读屏幕的同时,读取我们的情绪,并且能根据我们情绪做出反应,改变我们即将看到的东西。阅读几乎变成一种运动。就像5个世纪以前,大家看到有人默读时会感到奇怪一样,在未来,若有人观看着屏幕,身体却没有对内容产生反应的话,也会看起来很奇怪。
书籍曾擅长培养出深思的头脑,屏幕则鼓励更加功利性地思考。人们提出新理念、发现不为自己熟悉的事实之后,屏读会激起人们的反应,敦促他们去做些什么:人们可以研究术语;可以征询“屏友”的意见;可以查询其他观点;可以创建书签;可以与事物互动,或是发相关微博,而不只是坐在那里深思。阅读书籍会增强我们的分析能力,鼓励我们一路探求到脚注,然后得出观察结论。而屏读则鼓励我们快速建立起模式,将不同的理念结合在一起,从而将自己武装起来以面对每天数以千计的新想法。屏读会实时培养思想。我们会一边观看电影,一边对其评论。我们也可以在一个论据中提取出模糊不清的事实。我们还可以在购买小玩意之前,先阅读用户说明书,而不是等买了之后才发现它没法完成我们想要它完成的事情。屏幕是“当下”的工具。
屏幕用激发行动取代了劝阻行动。宣传在满是屏幕的世界里变得越来越没有效果,因为在假消息的传播速度和电子一样快的同时,更正信息的传播速度也是如此。维基百科之所以能够运行得这样不错,是因为它只需要一次点击就可以移除错误。这使其从一开始,就在消除错误信息方面比发布它要容易得多。在书中,我们找到被揭示出的真理;在屏幕上,我们通过碎片组合出自己的迷思。在网络化的屏幕上,一切与一切链接。新作品的地位并非由评论家的评分,而是根据它与其余世界的链接程度来判定。无论是人、物还是事,直到他们被链接,才得以“存在”。
屏幕能够揭示出事物的内在本质。在制造品上挥挥智能手机的摄像头,就可以得知它的价格、产地、成分和其他拥有者对它的评论。通过合适的app,例如谷歌翻译,手机屏幕就可以把菜单、指示牌上的外语以同样的字体即时翻译成你的母语。还有一种手机app,可以通过只出现在屏幕上的额外行为与互动,增强一只被填充过的儿童玩具的功能。这就好像是屏幕展示出了物品的无形本质。
随着移动屏幕变得更大、更轻盈、更强大,它们会被用来观察更多的这种内在世界。在街上行走时,只要拿上一块电子平板,或者戴上一副魔术眼镜或隐形眼镜,你就会看到前方被注释覆盖的真实街道:你会看到哪里的厕所干净,哪些商店卖的东西你会喜欢,你的朋友正在哪里闲逛……计算机芯片变得如此之小,屏幕也变得如此轻薄和便宜,以至于在未来30年,半透明的眼镜会为现实提供出一层信息。如果你拿起一件东西,并通过这种眼镜来看,那么这个东西(地方)的本质信息将会以文本覆盖的方式显现出来。通过这种方法,屏幕将能让我们“阅读”一切,而不仅仅是文本。
是的,这些眼镜看上去愚蠢不堪,就像谷歌眼镜证明的那样。但解决外观问题,让它们既时尚又舒适,还需要一段时间。仅仅去年一年,就有100亿亿(1018)只晶体管被集成进了电脑之外的物体当中。很快,从鞋子到罐头汤,这些最常见的制造品中都会包含一小块银色芯片,其中隐藏着智能。而屏幕将会成为我们用来和无处不在的知化互动的工具。我们会乐见这一切发生。
更重要的是,我们的屏幕还会观察我们。它们将会成为我们的镜子,成为我们对之凝视以找到自我的那些水井。它们并非映照我们的面容,而是映照我们的自我。已经有数百万人用口袋里的袖珍屏幕来输入自己的位置、饮食、体重、情绪、睡眠情况以及所见所闻。少数先锋已经开始了“life logging”,即记录生活中每一个微小的细节,包括对话、照片和活动。屏幕既可以记录,又可以播放这些活动的数据库。不断自我追踪的结果,是对他们生活没有瑕疵的“记忆”,也是对他们自身客观且可量化的审视。没有任何书籍可以提供这些。屏幕成为了我们身份的一部分。
我们在全方位、全尺寸地进行屏读:大到imax屏幕,小到苹果的apple watch。在不远的未来,我们将永远不会远离各种屏幕。屏幕将会成为我们寻找答案、寻找朋友、寻找新闻、寻找意义、寻找我们自己是谁以及能够成为谁的首选目标。
在不远的未来,我一天的生活将会是下面这样:
早上醒来,我还没有下床,就开始了屏读。我通过手腕上的屏幕查看了时间和闹钟,又看了看紧急新闻和滚动的天气情况。我在床边的一块小屏幕上查看了来自朋友的消息。之后,我用手指擦掉这些消息。我走进浴室,在墙上的屏读了最新的艺术品——朋友们拍摄的炫酷照片,和昨天的照片相比,它们更加欢乐,更加阳光。穿衣服的时候,我屏读了衣橱里的衣服。屏幕显示,红色袜子和我的衬衫搭配起来会更好。
在厨房,我通过屏幕浏览新闻全文。我喜欢平铺在桌面上的显示器。我在桌面上方挥动胳膊,就可以修改文本信息流的方向。我转而屏读厨房里的橱柜,寻找我最喜欢的麦片。橱柜门上的屏幕能显示出门后有什么东西。飘浮在冰箱上方的屏幕告诉我里面有新鲜的牛奶,于是我打开冰箱,取出牛奶。牛奶外包装上的屏幕想要让我玩一个游戏,但我退了出去。我屏读了碗,确认它是从洗碗机里拿出来的干净碗。在吃麦片粥的时候,我查询了盒子上的屏幕,来看看它是否新鲜,以及是否像一个朋友说的那样,麦片里有基因标记。我低头继续阅读桌子上的新闻和故事。当我专心阅读的时候,屏幕就会出现提醒,而新闻也会显示出更多的章节。我屏读得越深,文本中就会产生出更多的链接和更密的图片。我开始屏读一篇对本地市长的调查报道,这是篇长篇大论,但我要送儿子去上学了。
我冲向汽车。在车里,我还能继续刚才在厨房里被打断的故事。我的汽车可以为我屏读这篇报道,并在我开车的时候高声朗读出来。我们在高速公路上开车经过的沿途建筑,本身就是屏幕。它们往往只显示针对我的广告,因为它们认识我的车。这些屏幕都是激光投影屏幕,这意味着它们可以聚焦出只有我才能看到的图像,而其他路过的人从同一块屏幕中看到的内容却是不一样的。我通常会忽略它们,除非它们显示出的是和我正在车里屏读的故事相关的图片或图表。我屏读交通状况,来找出哪条路在今天早上最不拥堵。虽然汽车的导航设备能从其他司机的路线中学习,并且基本上会提供最佳路线,但也不免偶尔犯傻,所以我仍然想屏读下交通情况。
在我儿子的学校里,我看到走廊一面显示出的公共墙。我举起手掌,说出我的名字,屏幕就会通过我的面貌、眼镜、指纹和声音认出我来。它转变成我的个人界面。如果不介意在走廊里泄露隐私的话,我就可以在那里屏读信息。我还可以使用我手腕上的微小屏幕。我看了一眼想要仔细屏读的信息,然后将其扩展开。其中一些信息被我转发出去,剩下的那些则被我归了档。其中一条信息十分紧急。我在空中捏了一下,就立刻屏读到一场虚拟会议中。我在印度的合伙人正在同我交谈,他们正在班加罗尔 [14] 对我屏读。这种感觉非常真实。
终于,我到了办公室。刚碰到椅子,我的房间就认出了我,房间里包括桌子上的所有屏幕都为我做好了准备,让我从上次暂停的地方继续工作。在我处理一天的工作时,屏幕上的双双眼睛紧密地观察着我,尤其是我的手和眼睛。除了键盘输入之外,我还非常擅长使用全新的手势命令。在观看我工作16年之后,它们终于能参与进不少我的工作里来了。其他任何人都看不懂我屏幕上的符号序列,就像同事屏幕上的序列也让我犯迷糊一样。我们一同工作,却各自处在不同的屏读环境中。我们一面在房间里手舞足蹈,一面注视、抓取着不同的工具。我是个有点儿老派的人,仍然喜欢在手里握着小一些的屏幕。我最喜欢用的还是和我上大学时那种有皮革保护套的屏幕(屏幕是新的,但保护套是旧的),这种屏幕和我毕业后拍摄一部讲述睡在商场里的移民的纪录片时所用的屏幕是同一种。我的双手已经习惯了它,而它也习惯了我的手势。
下班后,我在户外慢跑的时候戴上了增强眼镜。我的跑步线路跃然出现在了我的面前。在路线上方,我还看到了心率、代谢统计等实时显示出来的全部锻炼数据。我还屏读了图景地点上更新后的虚拟标注。我在眼镜里看到一条笔记,是我朋友一个小时前在同一条线路上跑步时,记录下的替代路线。此外,我还在一系列熟悉的地标上看到了本地历史俱乐部(我是会员)留下的历史介绍。或许有一天,我会尝试下识别鸟类的app。当我路过公园时,那些鸟的名字就会贴在我的眼镜上了。
回家吃晚饭的时候,我们不允许个人屏幕出现在餐桌上,但还是屏读出了房间里的情绪颜色。晚饭过后,我会用屏读的方式来放松。我关注的一位世界构建师水平惊人,他新创建了一座卫星城市,我要戴上虚拟现实头盔去探索一番。有时我会沉浸在一部3d电影中,有时则会加入一场仿真游戏。和其他学生一样,我的儿子也屏读着他的家庭作业,尤其他的个人辅导。虽然一有机会他就会玩起屏读探险游戏,但在上学期间,我们把这个时间限制在了一个小时。他可以花一个小时就屏读一场仿真游戏——全程用快速屏读的方式,而与此同时,他还能在其他三张屏幕上屏读信息和照片。另一方面,我也试着慢下来。有时候,我会在我膝上的平板上屏读一本书,与此同时,墙上屏幕的文件压缩包会释放出缓慢悠长的景观。我的伴侣最喜欢不过的事情就是躺在床上,望着天花板屏读她最喜欢的故事,直到睡着。而我躺下后,会在手腕上的屏幕上把闹钟设置成早上6点。接下来的8个小时里,我将暂停屏读。
[1] 英语中的“权威”(authority)是“作者”(author)的派生词,由表示作者的author和表示性质、状态的后缀-ity构成。——译者注
[2] 作者原文意思是“无论什么东西,只要被夹在了封面和封底之间,就能成为‘书’(book)。”电话簿(yellowbook)、素描册(sketchbook)、画册(coffee table book)在英文中都有“书”(book)的含义,但对应的中文并没有这种说法,因此此处用意译代替。——译者注
[3] 此处的“书”和“订购”对应的原文都是book,该词为多义词,名词含义是书,动词含义为订购。——译者注
[4] goodreads是一家图书分享型社交网站,允许访客搜索网站内的书目、注释和书评。注册用户可以添加新书目和推荐书单,也可以建立自己的图书讨论小组。——译者注
[5] 维基(wiki)是一种在网络上开放且可供多人协同创作的超文本系统,使用维基系统的网站称为wiki网站,它允许任何访问它的人快速轻易地添加、删除和编辑所有的内容,而且通常都不需登录,因此特别适合团队合作的写作方式。——译者注
[6] 杜威十进制图书分类法,是由美国图书馆学学家麦尔威·杜威于1876年提出的图书分类法,经过22次大改版后,已被全球超过135个国家的图书馆采用。在美国,几乎所有公共图书馆和学校图书馆都采用这种分类方法。——编者注
[7] 卡津人(cajuns),又称阿卡迪亚克里奥尔人(acadian-creoles),是主要居住在美国路易斯安那州的一个族群,主要由被流放的法国殖民者后裔组成,大多数是早期法国殖民者和北美洲原住民的混血后代。自在路易斯安那定居后,卡津人发展出了生机勃勃的文化,包括独特的风俗、音乐和食物。——译者注
[8] 黄色新闻是新闻报道和媒体编辑的一种取向。在理论上,以煽情为基础;在操作层面上,注重犯罪、丑闻、流言蜚语、灾异、性等问题的报道,采取种种手段以达到迅速吸引读者注意,同时策动社会运动。19世纪末美国报业大亨威廉·赫斯特和约瑟夫·普利策之间的报业竞争使黄色新闻成为美国新闻史上一种正式潮流。——译者注
[9] 是美国访问量最高的求职网站。——译者注
[10] 是谷歌开发的可穿戴智能设备,眼镜上附有小型显示器,具有信息浏览、增强现实、智能语音操作等功能。——译者注
[11] 特拉法加广场(trafalgar square)是伦敦市的著名景点,建于1805年。——译者注
[12] 穆里尔·鲁凯泽(muriel rukeyser),20世纪美国女诗人与政治活动家,倡导女性平等、自由。——译者注
[13] wii是日本任天堂公司制造的体感游戏机,游戏机可以通过手柄上的传感器检测玩家的肢体动作,从而使玩家可以在屏幕前挥动身体操作游戏。——译者注
[14] 印度城市,以软件外包行业闻名。——译者注
第5章 使用 accessing
来自techcrunch 上的收藏夹里提取图片来填充我的墙壁。我的父母订了一个博物馆服务,那样他们就可以通过轮流排位的方式借阅到一些颇具历史的艺术作品,但那不在我的兴趣范围之内。最近一段时间,我在尝试3d雕塑,它们可以每个月都进行重新塑形,使你保持对它们的关注。当我还是个小孩子时,我玩的玩具就来自“环球物料”,它们伴随着我长大。我的母亲曾经这样说:“你只会玩它们几个月,为什么要拥有它们呢?”所以每隔几个月,玩具就会被放进盒子里,然后新的玩具就会出现。
“环球物料”实在是太聪明了,每当我要出行时,即使是出行高峰,通常等待的时间也超不过30秒。汽车会及时出现,因为它知道我的行程,而且还能从我的短信、日历和电话中推断我的出行计划。我最近在尝试省钱,所以有时我会与其他去工作的两三个人拼车。车上的网络带宽很是充足,所有搭车的人都可以进行屏读。说到锻炼身体,我订了一些健身房服务和一个自行车服务。我很快就得到了一辆最新款的自行车,它已经被调试和清洗过,就停在我的出发点。进行长途旅行时,我喜欢用那些新型的单人无人驾驶飞机。但由于它们比较新,所以想立即得到它们还比较难,不过现在的商用飞机相也比从前方便多了。只要我去旅行的城市中有类似的综合性公寓可以提供交互服务,我基本不需要收拾什么行李,因为我可以从当地的“网点”那里得到一切与我日常使用的一模一样的东西。
有时,父亲会问我是否曾因不拥有任何东西而感到不踏实、不可靠。我告诉他自己的感觉恰恰相反——我感到自己与原始社会有着深刻的联系。我感觉自己就像一个原始社会中的狩猎者,他穿行于复杂的自然环境中时不会去拥有任何东西,却可以在需要时随时随地地获得一个工具,用完后便将其抛之脑后,继续前行。只有农民才需要一个谷仓来储藏他的财富。数字原住民 [8] 是自由地奔向前方的,他们不会承受拥有事物所带来的负累,可以自由地探索未知的世界。使用而非拥有事物,使我可以保持敏捷和精力充沛,时刻为即将出现的未知事物做好准备。
[1] 美国科技类博客,主要报道新兴互联网公司,评论互联网新产品,是美国互联网产业的风向标。——译者注
[2] airbed and breakfast,缩写airbnb,是一家联系旅游人士和家有空房出租的房主的服务型网站。——译者注
[3] 玛丽.波平斯(mary poppins),电影《欢乐满人间》中会魔法的仙女保姆。——译者注
[4] 会员制连锁工具店,缴纳会员费后,会员可以免费使用各种制作工具和设备。——译者注
[5] 均为会员制电商,用户提交身高、体重、肤色、风格等信息后,按月缴纳会费后会定期收到由商家根据用户信息推荐的衣服。——译者注
[6] 区块链(blockchain),是比特币的重要概念,指一串使用密码学方法相关联产生的数据块。每一个数据块都包括过去十分钟内所有比特币网络交易的信息,用于验证该信息的有效性和生成下一个区块。——编者注
[7] 全球最热门的图片社交网站之一。在这个网站上,新的图片会不断加载在页面底端,用户可以随时收藏自己喜欢的图片,其他用户可以关注并转发这些图片。——编者注
[8] 数字原住民(digital natives),哈佛大学网络社会研究中心提出的新概念,指80后以及更年轻的新一代人,他们出生时就面对无所不在的网络世界。——译者注
第6章 共享 sharing
比尔·盖茨曾经嘲笑过那些免费软件的倡导者,并给这些倡导者冠上一个资本家所能想出的最恶毒的绰号。他说,那些要求软件免费的人们是“当下的共产主义者”,他们是一股致力于摧毁垄断的邪恶势力——而正是对垄断的追求支撑起了美国梦。盖茨的言论有几点错误,其中一点就是,免费开源软件的爱好者更有可能是政治自由主义者,而非共产主义的左倾分子。不过他的指责也并非全错:当一场席卷全球的浪潮将每个个体无时无刻地连接起来时,一种社会主义的改良技术版正在悄然兴起。
数字文化中的公有部分体现在更为深层和广泛的方面。维基百科仅是这一新兴集体主义中一个较为突出的例子。事实上,所有类型的维基都是集体主义的体现。维基是指通过协作而产生的文档集合,任何人都能方便地创建、增删或修改其中的文字内容。各式各样的维基引擎运行在不同的平台和操作系统上。沃德·坎宁安(ward cunningham)在1994年首次发明了协作式的网页,如今他追踪记录着将近150个维基引擎,而每个引擎都支持着数量众多的网站。“知识共享”(creativemons)这种利于共享的版权许可协议已被人们广泛接受,它鼓励人们准许他人合法地使用和改进自己的图像、文本或音乐,而无需额外许可。换句话说,内容的共享和摘取是新的默认模式。
2015年采用知识共享的实例已达10亿之多。像tor一样的文件共享网站比比皆是,凡是可以被复制的文件几乎都可以在这些网站上找到。这些网站使得我们向协作互助又迈进了一步,因为你可以利用一些已经被创造出的东西十分方便地开始你自己的创作。类似digg、stumbleupon、reddit、pinterest以及tumblr这样的社交评论网站使得数以亿计的普通人可以到专家和朋友资源库那里查找照片、图画、新事物和新创意。然后大家一起对这些材料分级、评判、共享、转发、注解,并将这些材料重组到自己的数据流或资源库里。这些网站就像协同过滤器,将当下最好的内容推荐给读者。几乎每天都会有一家新的创业公司骄傲地宣称他们找到了一个新的管理社区的方式。所有这些发展都预示着我们在稳步迈向一种网络世界所特有的、数字化的“社会主义”。
我们并不是在讨论祖父辈的社会主义政治体系。事实上,这种新的社会主义不同于以往的任何一场运动。它并非阶级斗争,也不是反美主义。恰恰相反,数字社会主义可能正是美国的最新创新。老套的社会主义是政权工具,而数字社会主义则是一种与政权无关的社会主义。这种新型的社会主义运行在文化和经济领域,而非政府层面——至少目前如此。
盖茨曾用以抹黑共享软件(如linux和apache)开创者的老套共产主义诞生于一个中心化的信息传播时代。彼时,工业流程过于强调上层管理,地域边界被强行划分。这些自上个世纪之初就存在的制约条件催生了一种集体所有制,试图通过由少数拥有无上权威的专家所精心制定的5年规划来代替一个混乱且无效的自由市场经济。毫不夸张地说,这种类型的政府管理系统已经失败了。工业时代诞生的这种自上而下的社会主义无法保持快速的适应力和持续的创新力,也不具备民主自由市场所能提供的自发动力。社会主义计划经济和中央集权的共产主义政体已成明日黄花。新兴的数字社会主义不同于老式的社会主义,它借助网络通信技术运行在没有边界的互联网上,催生了贯穿全球一体化经济的无形服务。它旨在提升个人的自主性,反对中央集权。它是去中心化的极致表现。
我们聚集在集体空间而非集体农场里;我们通过桌面工厂而非国有工厂与虚拟的合作社相连接;我们共享脚本和应用程序接口而非锄头与铁铲。我们没有高高在上的政治局,但却有未曾谋面的社群领袖,对于社区管理来说,唯一重要的事情就是把事情做成。我们没有举国体制,但却有大众协同机制。我们不实行免费的政府配给和补贴,但却提供免费的商品和服务。
我必须承认,“社会主义”这个词会使很多读者感到不适。它背负着巨大的文化包袱,与之类似的词语也有着同样的处境,譬如“公有的”、“公有制的”和“集体的”。而我之所以用“社会主义”这个词,是因为从技术角度看,它最能恰如其分地指代那些依靠社交互动来发挥其作用的技术。“社会化媒体”(即社交媒体)之所以被称为“社会化的”也是基于同样原因:它是一种社会化活动。宽泛地说,社会化活动是网站和移动应用在处理来自于庞大的消费者(或称为参与者/用户/受众)网络的输入时所产生的。当然,将形形色色的组织都置于这样一个带有煽动性的头衔下还是存在很大风险的。但在共享这一领域里没有什么未被污染的词汇可供使用,所以我们不妨重新定义这组最为直接的词汇:社会的、社会化活动、社会化媒体、社会主义。当众多拥有生产工具的人都朝着一个共同的目标努力,共享他们的产品,不计较劳务报酬,乐于让他人免费享用其成果时,新社会主义的叫法也就不足为奇了。
两类社会主义的相同之处就是共享这个动词。事实上,一些未来学家已经将这种新型社会主义在经济层面的体现命名为共享经济(sharing economy),因为在这一层面最基本的通行规则就是共享。
20世纪90年代末期,活动家、布道者、老牌的嬉皮士约翰·佩里·巴洛(john perry barlow)曾以略带戏谑的口吻将这一潜在趋势称为“网络共产主义”(dotmunism)。他将网络共产主义定义为“由具有完全自由意志的个体所组成的劳动力”,也是一个去中心化的、没有货币的物物交易经济体;在那里没有财产所有权的概念,政治体制由技术架构来决定。他关于虚拟货币的观点是正确的,因为推特和脸谱网上发布的内容都是由无需支付报酬的参与者创建的,也就是像你一样的观众。巴洛关于所有权消亡的观点也是正确的,正如前面章节已经说明过的,我们可以看flix和spotify这样的共享式经济服务正在让用户摆脱占有物品的观念。但是用社会主义这个词来指代正在发生的事情也有其不恰当的一面:它并非一种强调意识形态的“主义”,也不会要求人们对其具备坚定的信念。它更像是一种态度、一类技术、一些工具,可以推进协作、共享、聚合、协调、灵活机构以及其他各种各样新兴的社会合作形式。它是前沿,也是创新的沃土。
媒体理论家克莱·舍基(y shirky)在其2008年出版的《未来是湿的》(herees everybody)一书中提出了一套划分新兴社会组织形式的架构。随着人们协同程度的增加,群体从只需最低程度协同的共享起步,而后进步到合作,再然后是协作,最终则达到集体主义。每一步发展都需要进一步的协同。只要纵览一下我们的在线领土就会发现大量的相关证据。
分享
在线公众有着令人难以置信的共享意愿。在脸谱网、flickr、instagram以及其他类似网站上贴出的个人照片数量每天都有18亿之多,可以毫不夸张地说,用数码相机拍的绝大多数照片都会以某种方式进行分享。在网络上分享的还有状态更新、位置标注、不成熟的想法。还有就是youtube上提供的数十亿个视频,同人站上贴出的数百万篇粉丝创作的故事。分享组织的名单几乎是无法穷尽的:比如专门分享评论的yelp,专门共享地理位置的foursquare,专门分享图片剪贴的pinterest。分享的内容几乎无所不包。
分享是数字社会主义中最温和的表现形式,但这样一个动词却是所有高级水平的群体活动的基础。它也是整个网络世界的基本构成成分。
合作
当个体们为实现一个更大目标而共同工作时,群体层面的结果就会涌现出来。flickr和tumblr上的爱好者们不仅仅是在共享数十亿张照片,他们还要对照片进行分类、贴标签、加关键词。社区中的其他人则会遴选照片做成合辑和剪贴板。“知识共享”许可的流行也就意味着从某种程度上说你的照片就是我的照片。任何人都可以使用他人上传的照片,就像是公社的成员可以使用公社所有的手推车一样。我不用再拍一张埃菲尔铁塔的照片,因为网络“公社”可以提供一张比我自己拍得更好的。这也意味着,当我要做展示、报告、海报、网站时,我可以做得更好,因为我不是一个人在工作。
数以千计的聚合网站都会采用类似的社交模式以实现三重收益。首先,面向社交的技术可以帮助用户根据自身需要来为他们所找到的东西分门别类、评价和收藏。社区成员可以更方便地管理自己的收藏。例如,pinterest里有着丰富的标签和分类(按钉功能),使得用户可以很快地创建任一类别的剪贴相册,并且超级方便地查找或添加图片。其次,这些标注、按钉、书签也可以使其他用户获益,帮助他们更方便地找到相似的材料。如果一个图片在pinterest上获得越多的按钉,或是在脸谱网上获得越多的点赞,或是在推特上获得越多的话题标签,那么它对别人的帮助就越大。第三,集体行为可以创造一种只有当群体作为一个整体时才会有的附加价值。比如,当大量由不同游客在不同时间从不同角度为埃菲尔铁塔拍摄的照片汇聚在一起时,并且每张照片都有详细的标注,那么就可以将这些照片(借助软件,比如微软的photosynth)整合出令人惊叹的3d全景渲染结构图,而这要远比每个个体的拍摄更为复杂,也更有价值。有意思的是,这一方式已经超出了社会主义者许诺的“各尽所能,按需分配”,因为它做到了“增益付出,超需回报”。
社区共享可以释放出惊人的力量。类似reddit和推特这样的网站允许用户投票或者转发最重要的信息(新闻、网址链接、评论),它们对公众话题的引导堪比甚或超出报纸和电视。有志于此的内容贡献者会继续贡献内容,在某种程度上是因为这些工具有着更广泛的文化影响力。社区的集体影响力已经远远超出了贡献者个人力量之和。这就是社会化机构的全部要义所在——整体优于部分之和。传统社会主义试图通过国家政权来实现这一目标。现在,数字共享则超脱了政府,在国际范围内发挥作用。
协作
有组织的协作所能取得的成果要超出临时的合作。只需看看那几百个开源软件项目中的任何一个——比如构成大多数网络服务器和智能手机底层架构的linux操作系统,你就能有所了解。精细调校的公用工具可以让成千上万个成员协同工作,从而产出高质量的产品。相比之前提到的临时合作,针对庞大复杂的项目所展开的协作通常只会给参与者带来间接收益,因为群体中的每个成员只会与最终产品的一小部分打交道。一位热心参与者可能要花几个月来为项目的子程序写代码,而项目的全面应用则是几年之后。事实上,以自由市场观点看,这种劳动报酬比是十分不正常的,即工作者做了巨量的、有很高市场价值的工作,却不获得任何报酬。这种协作方式是资本主义所不能理解的。
除去经济学上尚无法解释这种现象外,我们其实已经习惯了免费地享用这些协作成果。今天全球近半数网站所在的服务器(有3500万台之多)都在使用免费的、由社区开发和维护的、开源的apache软件。一个名为3d warehouse的免费素材库可提供数百万个复杂的3d模型,任何你能想到的东西——小到靴子,大到桥梁——都能在这里找到。这些模型的创建者和提供者都是非常专业的热心人士。由社区设计、学生和爱好者制造的开源硬件arduino已将近一百万台,类似方式生产的迷你电脑raspberry pi则已接近六百万台。人们被鼓励自由和免费地复制这些产品的设计,并在此基础上开发新的产品。尽管没有金钱回报,但创造这些产品的大众生产者获得了信誉、地位、声望、享受、满足和体验。
当然,这种协作本身并没有什么新鲜之处。但这些新的在线协作工具为公有生产形式提供了支持,使得人们可以摆脱对资本主义投资者的依赖,将成果的所有权保留在生产者(同时也是消费者)手中。
集体主义
大多数西方人,包括我自己,都被灌输了这样一种观点——个人权力的扩张必然会削弱国家权力,反之亦然。然而现实中大多数政治组织会将一些资源社会化,将另一些资源个体化。大多数走自由市场道路的国家经济体已经将教育和治安进行了社会化,而即便是当今最社会主义的社会也允许一些私人财产的存在。这两者的混合比例在世界各地都有所不同。
与其将技术社会主义视为自由市场个人主义和中央集权这一对零和博弈的某种妥协,不如将技术共享视为一个新的、能同时提升个人和群体价值的政治操作系统。共享技术其未曾言明但又不言而喻的目标是同时最大化个体自主性和群体协同力量。因此,数字共享可以视为第三条道路,与老旧传统观点存在着很大的差异。
第三条道路的观点得到了尤查·本科勒(yochai benkler)的回应,他是《网络财富》(the wealth ofworks)一书的作者。关于网络政治,他可能比任何人都要思考得多。他说道:“我认为社会化生产和大众生产可以作为以国家为基础的或者以市场为基础的封闭式所有权系统的替代,”他还补充道,“这些活动可以促进创造力、生产力以及自由。”这个新的操作系统既不会像传统的集中计划式共产主义那样不容许私有财产,也不会像自由市场那样充斥着自私自利。”它是一个新的设计体系;在这里去中心化的公众协同可以做到单纯的共产主义或单纯的资本主义所无法做到的,解决问题,创造事物。
将市场机制与非市场机制融合的混合系统也不是什么新鲜事。数十年来,学者们对意大利北部和西班牙巴斯克工业区的去中心的社会化生产方式做了大量研究。在这些地区,企业员工就是企业的所有者,他们自己选择管理层和利润分配方式,独立于国家控制。但只有当低成本的、即时的、无处不在的在线协作出现后,这些理念的核心要点才有可能被移植到广泛的新领域,比如编写企业软件或参考书。
我们的梦想就是将这第三条道路的应用范围扩大,不再停留于局部地区的实验。去中心化的协作究竟能有多大规模?跟踪研究开源产业的黑鸭开源中心(ck duck open hub)表示,有大约65万人在为至少50万个项目工作。这个人数几乎是通用汽车公司职工总数的三倍。尽管他们并非全职为这些项目工作,但这毕竟表明了有大量的人们在无偿工作。设想一下,如果通用公司的全体雇员得不到报酬,他们还能继续生产汽车么!
到目前为止,最大的成就是开源项目。而最大的开源项目,譬如apache,会涉及到数百个贡献者的管理,其人员规模相当于一个村落。某项研究估计,fedora linux 9的工作量相当于6万人年。这些案例表明,自组织和共享机制可以管理村落级别的项目。
而参与在线合作的人数则要巨大得多。像reddit这样的协作筛选网站每月有1.7亿次独立访问,每天都有1万个活跃的在线社群。youtube声称每月有10亿活跃用户,以这些用户为主力制作的视频正在与电视台竞争。维基百科则有将近2500万注册用户为其贡献内容,其中13万用户特别活跃。有至少3亿活跃用户在instagram上贴出照片;每月都有超过7亿个群组活跃在脸谱网上。
“集体软件农场”的成员数量以及参与共同决策项目的人员数量尚无法与一个国家的人口数量相比。但是社交媒体所覆盖的人员数量是巨大的,并且还在持续增长。脸谱网上有至少14亿的公民在免费共享他们在“信息公社”里的生活。如果脸谱网是一个国家的话,那么它将是这个星球上人口最多的国家。而且这个国家的整个经济建立在无需支付报酬的劳动力之上。有10亿人每天花费大量时间为它免费创造内容。他们报道发生在他们身边的故事,总结经历,添加评论,创作图片,开玩笑,贴酷图,制作视频。他们的“回报”体现在由14亿个相互关联的、真实的个体所产生的沟通和交往中。他们的回报就是被准许继续留在这个公社里。
有人也许会认为这些构建了替代有偿劳动机制的家伙们会包藏着很多政治意图。但设计共享工具的程序员和骇客们并不认为自己是改革者。根据一份针对2784位开源开发者的调查,他们无偿工作的最主要动机就是“学习并发展新的技能”。一位学者是这样解释的(大致意思):“无偿工作的主要原因就是为了改进我自己那糟糕的软件。”太过明显的政治意图基本上都不具实用性。物联网与其说是受经济学支配的产物,莫不如说是由分享意愿驱动的作品。
然而,在新兴的共享、合作、协作以及集体主义浪潮下,公民们无法完全不触及政治。我们从协作中受益越多,就会愈发欢迎政府中的社会化机制。那种统治朝鲜的压迫性的精神摧残系统已经消亡了(除朝鲜之外);未来的管理模式将会混合了从维基百科和瑞典民主社会主义模式中获取的经验。会有人竭力阻挡这一趋势,但持续增长的共享是必然的。尽管如何命名未来的模式尚无定论,但共享技术仍来日方长。在共享这把尺子上,如果满刻度是10的话,我们目前的刻度只是2。专家们曾经认为很多话题是当代人绝不会共享的:我们的财务状况,我们的身体问题,我们的性生活,我们内心最强烈的恐惧;但事实证明,只要借助恰当的技术、在恰当的条件下、辅以恰当的收益,我们就会共享一切。
这样一种趋势会把我们与一个非资本主义的、开源的、大众生产的社会拉得有多近?不管什么时候提出这个问题,答案总是:比我们想象的要近得多。回想下craigslist,你会认为那就是个分类广告网站,对吗?事实上,craigslist远不止于此。它将身边社区里信息公告板的影响范围扩大到地区,并用图片改进了广告效果。它让消费者自己动手输入他们的广告,并以实时更新的方式保证信息的时效性;最为重要的是,它是免费的!一个全国范围内的免费广告服务!那些负债累累的报刊企业如何能与之竞争?无需政府拨款和管控,将市民和市民直接联结起来,无时无刻,无处不在。这一几乎免费的市场所实现的社会效益建立在效率基础之上(网站在顶峰时期也只有30个员工),足以使任何政府组织或传统企业汗颜。固然,这种点对点的分类广告损害了报刊的商业模式,但同时它也提供了无可争辩的事例,即无论是追求利益的企业还是靠税务支撑的民政机构,共享模式都是一种可行的替代方案。
公共医疗保健领域的专家们曾经信誓旦旦地声称,共享照片尚可被接受,但没有人会愿意共享他们的病历记录。但是在patientslikeme这家网站上,患者们将治疗结果汇聚起来,以便改进他们自己的治疗。这证明集体行为可以战胜医生意志和隐私恐慌。在推特上共享你的所思所想,在stumbleupon上共享你的阅读,在wesabe上共享你的财务状况,在脸谱网上共享你的点点滴滴……这种日渐被接纳的共享习惯正在成为我们文化的一个基础部分。当我们以协作的方式构建百科全书、新闻机构、影视档案、软件应用时,当我们在跨越大洲的小组中与素未谋面的人一起工作时,当我们并不在意合作者的社会地位时——政治上的社会主义似乎是顺理成章的下一步。
第7章 过滤 filtering
对于一名读者、一位观众、一个听众,亦或是人类思想表达运动中的一个参与者而言,再没有比现在更好的时候了。每年,都有如雪崩般的大量新鲜事物被创造出来。每年我们生产出800万首新歌,200万本新书,1.6万部新电影,300亿个博客帖子,1820亿条推特信息,4万件新产品。今天,任何一个普通人都无需花费太多力气,最多就是抬下手腕的过程,就能召唤出包容万物的图书馆。只要你愿意,你就可以阅读大量的用古希腊语书写的希腊文章,数量多得要比古希腊罗马时期最有名望的希腊贵族所能看到的还要多。同样帝王般的享受也适用于中国古代的卷轴书籍;相比中国古代的帝王,你的家中就可以有更多这些藏书。无论是文艺复兴时期的蚀刻版画,还是莫扎特协奏曲的现场演出,在当时都难以见证的珍贵资源,现在都可以便捷获得。在以上每一个方面,当今媒体的丰富繁荣都已经达到了空前的顶点。
根据我所能找到的最新记录,这个星球上记录在各个地方的歌曲总数量是1.8亿首。使用标准的mp3压缩比率,人类所有现存的音乐可以收纳到一个20tb大小的硬盘里。而今天一个20tb的硬盘售价为2000美元。5年之后,这种容量的硬盘售价将为60美元,并且其体积小到可以装进你的口袋里。用不了多久,你就可以将人类的所有音乐装到你的裤兜里随身携带。但另一方面,既然这个音乐图书馆如此之小巧,你又何必费事地将其带在身上呢?因为那时你完全可以根据自己的需要,直接从云端访问世界上所有的歌曲。
发生在音乐上的这一变化,也会发生在任何一个或者每一个可以用比特表达的事物上。在我们有生之年,由所有图书、游戏、电影以及每个打印出的文字构成的综合图书馆会24x7小时地对我们开放,所需的接口也只是那同一块屏幕,或者是同一个云端路径。而且每一天,这个图书馆都在膨胀。我们互为消费者相遇的可能性系数已经因人口的快速扩张而随之扩大了,而简化创造过程的技术进步将这种可能性进一步扩大。现在全球人口数量是我出生那年(1952年)的三倍,而未来10年内 [1] 应该还会再增加10亿人。在我出生以后,新增加的50亿至60亿人中有越来越多的人借助现代化发展的富足和安逸得以从枷锁中解放,他们可以自由地产生新观点,创造新艺术,制作新事物。今天制作一个简单的视频要比10年前容易10倍;设计并制作一个小的机械零件要比100年前容易100倍;写作并出版一本图书要比1000年前容易1000倍。
以上这些变化的结果就是我们来到了一个无限大的大厅里,在每一个方向,都堆砌着无数种可能的选择。尽管类似汽车无线电制造这种老旧行业被淘汰消失,但可供选择的职业种类却变得更加丰富了。度假的地方、吃饭的地方,甚至是食物的种类,这些可供选择的选项数量每年都在累加。可供投资的机会也在迅速增加。可供参加的课程,可供学习的东西,可供娱乐的方式,这些选项的数量已经膨胀到天文数字级别。在人们有限的一生中,没有人有足够的时间把每个选择的潜在影响都逐个审视一遍。即使只是对过去24小时里被发明或创造出的新事物进行概览,也会花费我们一年以上的时间。
这个包容万物的图书馆规模极其巨大,它迅速吞没了我们本就十分有限的消费时间周期。我们将需要额外的帮助才能穿越这广袤之地。生命如此短暂,却有太多的书需要去读。我们需要某些人或者东西来做出选择,或者在我们耳边悄悄地告诉我们该如何选择。我们需要一种对信息进行分类的方法,而唯一的选择就是寻求帮助来指导我们如何选择。我们借助各种各样的方法对铺在面前的令人眼花缭乱的选项进行筛选。很多这种过滤方法都比较传统,而且依旧发挥着作用。
我们通过“守门人”来过滤信息:权威、父母、牧师和老师都会将坏的东西挡在门外,选择性地把“好东西”放进来。
我们通过媒介来过滤信息:在图书出版商、音乐制作室和电影工作室的办公室桌上总是堆起很多被否掉的项目。他们说“不”的时候要远多于说“是”,这就对那些广泛传播的信息起到了过滤的作用。报纸的头版新闻也是过滤器,因为它对这些头条说“是”的同时就忽略了其他消息。
我们通过管理者过滤信息:零售店不会采购每样东西,博物馆不会展出每件藏品,公共图书馆不会收藏每一本书。所有类似的管理者都会选择他们所认可的商品,从而起到过滤器的作用。
我们通过品牌过滤:面对着堆满相似产品的货架时,第一次采购的买家会保守地选择一个熟悉的品牌,因为这是降低采购风险的一种便捷方法。通过品牌,可以将混杂的东西过滤掉。
我们通过政府过滤:禁忌的东西会被禁止,有时甚至会被清除,比如充满仇恨的言论、对国家领导人的批评以及对宗教的批判。而国家主义的相关议题则会被提倡。
我们通过我们的文化环境过滤:儿童会接收到不同的信息、内容和选择,依据的标准则是他们身边的学校、家庭以及社会对他们的期望。
我们通过我们的朋友过滤:同伴对我们的选择有很大的影响。我们很有可能会选择朋友选择的东西。
我们通过自身来过滤:我们依据自己的喜好和判断来做出选择。传统上讲,这才是最珍贵的过滤器。
在面对如今信息过度丰富的状况时,上面这些方法并未消失。但在处理未来10年急剧增长的各种选择时,我们就要发明出更多类型的过滤方法了。
设想你生活在这样的一个世界里——那些被制作出的每部伟大的电影、每本伟大的书籍、每首伟大的歌曲都像“免费”似的触手可得,而你那精致的过滤系统则已经将废话、垃圾和其他可能会让你感到丝毫不爽的东西统统清除掉。将那些广受好评却对你个人没有任何意义的发明统统抛之脑后,而只去关注那些能真正令你兴奋的事情。你唯一面临的选择就是品尝这百分百的精华中的精华,而你最好的朋友给你推荐的东西中,也会包含一些“随机”的选项以让你偶尔感到惊喜。换句话说,你只会遇到那些在此时此刻与你完全匹配的事物。经过你的过滤器筛选后,唯一在前方等着你的就是那成堆的令你疯狂的事物。
例如,在你设置筛选书目标准时,可以设定只选读那些最伟大的作品,例如仅仅关注由遍览群书的专家选定的书籍,并让他们引导你阅读被视为西方文化精粹的60卷精选文集,即著名的《西方世界的伟大著作》(great books of the western world)系列。但即使如此,你或任一个普通读者都要花2000小时才能完全读完这2900万字的系列书籍,遑论这还只是西方世界的文化典籍。因此,我们大多数人还需要更进一步的过滤。
但问题在于,我们一开始有太多的备选项,这使得我们即使只挑选出一百万分之一,仍然会面临很多选择。有很多对你而言可以给五颗星的电影,但你一生中却没有足够的时间把它们都看完。有很多特别适合你的工具,但你没有足够的时间把它们都掌握。有很多很酷的网站会让你流连忘返,但你没有足够的精力把它们都尝遍。事实上,也有很多超棒的乐队、图书、小玩意正合你胃口,而也你没有足够的时间去体验,即使你的全职工作就是干这个,也是不可能的。
尽管如此,我们仍然试图将这些大量丰富的信息缩减到令人满意的程度。让我们先从理想途径开始探索。以我自己为例,我会选择将我的注意力投向哪里呢?
首先,我想先查收下我认为我会喜欢的东西。这种个人过滤器早就已经有了,即我们所说的推荐引擎。亚马逊flix、推特、领英、spotify、beats、pandora,以及其他聚合类网站,都在广泛使用推荐引擎。推特会使用推荐系统来向我建议我应关注的人,所依据的信息就是我已经关注了谁。pandora使用类似的系统向我推荐我可能会喜欢的新音乐,依据的是我曾标出的喜欢的歌曲。在领英建立的关系网络中,有一半以上都是源于他们的相关推荐系统。亚马逊的推荐引擎则塑造了著名的广告标语,即“喜欢这件商品的人也喜欢下面这一件”flix也是利用类似的系统向我推荐电影。巧妙的算法会对每个人的大量行为记录进行汇总分析,以期能够及时地预测我的行为。他们的猜测有一部分是基于我过去的行为,所以亚马逊的标语应当说“根据你的个人历史记录和与你相似的其他人的历史记录,你应该会喜欢这个”。他们的建议会根据我曾经购买过,甚至是我之前想买的东西来做精细调整(他们会追踪我在一个网页上停留思考的时间,即使我最终没有选择它)。通过对10亿条过往购买记录的相关性计算,他们的预测会相当有先见之明。
这些推荐型过滤器是我主要的探索机制之一。平均而言,我发现相比专家或朋友的建议,这些推荐引擎更为可靠。事实上,很多人都意识到了这些过滤性推荐系统的有效性,以至于“更多类似”(more like this)的销售方式已经占到了亚马逊销售额中的第三位——2014年时通过这种方式达成的销售额超过了300亿美元。这种系统对flix而言也有着巨大价值,所以他们雇用300多个人从事推荐系统的相关工作,并且还投入1.5亿美元的预算。在2006年flix拿出100万美元作为奖励,征集能够提升他们现有推荐系统工作效率的算法,任何一个研发团队只要能帮他们提升10%的效率,就可以获得奖励。有一点是必然的,即一旦这种推荐引擎开始运行后,没有任何人会干涉这些过滤器。因为算法的识别是基于我(和其他人)生活中极其细微的行为习惯,而那是只有不需要休息、不停运作的机器才可能注意到的细节。
然而,只接触那些你已经喜欢的东西是有风险的,即你可能会卷入一个以自我为中心的漩涡,从而对任何与你的标准存在细微差异的事情都视而不见,即使你原本会喜欢它。这种现象被称为“过滤器泡沫”(filter bubble),技术术语是“过适”(overfitting)。你卡在了一个小高点的位置,而你却自认为自己是在顶点上!有大量证据表明这种现象在政治领域经常发生;党派中的成员通常只依据“跟这很像”这一简单的过滤方式来筛选信息,一个党派中的成员几乎不会去阅读他们党派之外的书籍。这种过适的状况会使他们的思维变得僵化。但这种过滤器引发的自我强化过程也会发生在科学领域、艺术领域,以及整个文化层面。“更多类似”这种过滤器越有效果,我们将其与其他过滤器合并使用就越有必要。例如,雅虎的一些研究者设计了一种方式,可以自动绘制出个人在选择领域中所处位置的可视化图谱,如此一来,过滤器泡沫就变得清晰可见,而一个人从过滤器泡沫中爬出来也变得简单多了,他只需在某些方向做些微调整即可。
理想过滤器的第二点是,我想知道我的朋友喜欢什么,而那又是我现在还不了解的。在某些方面,推特和脸谱网就以这种过滤器的形式服务。通过关注你的朋友,你可以毫不费力地获取你朋友的状态更新,而那通常就是他们认为酷炫到足以分享的事情。借助手机里的文本或照片,可以十分简单地发出自己的推荐,因此如果有人发现了什么新鲜事物却不分享,我们会感到很吃惊。但如果朋友与你太像,他们也会诱发过滤器泡沫。亲密的朋友会营造出一个回音室,将相同选择的影响放大。有研究表明,再跳入到下一个圈子,即朋友的朋友中,往往就足以将选择的范围扩大到我们预料之外的地方。
理想过滤器的第三点是,它将是一种会向我建议某些我现在不喜欢但想尝试着喜欢的东西的信息流。这有点类似于我有时会尝试最不喜欢吃的奶酪或蔬菜,仅仅为了看下自己的口味是否已经改变。我十分确信自己不喜欢歌剧,但去年我又尝试了一次,那是在一个电影院里看一个歌剧的远程实况转播——在纽约大都会艺术博物馆(the met)上演的《卡门》,对白以文字的形式显眼地投放在大屏幕上,最后,我很庆幸自己去了。专门用于探测一个人不喜欢什么的过滤器必须设计得十分巧妙,但依然还是可以借助大型协同数据库的力量,而这些数据库就是本着“不喜欢这些东西的人,会尝试着喜欢这个”的原则设立的。以类似的方式,我有时也想要点儿我不喜欢却又是应该学习的东西。于我而言,可能就是与营养补充品、政治立法细节或者嘻哈音乐有关的一些东西。伟大的老师总会有些小窍门,使得他们可以将令人讨厌的知识以一种不把人吓退的方式打包传达给不情愿的学生;伟大的过滤器也能做到这一点。但任何人都会注册申请这样的一个过滤器么?
现在,没有人会注册申请任何类似的过滤器,因为这些过滤器已经内置到各个平台里了。脸谱网上每个用户平均有200个关注的朋友,而这些朋友会发布状态,更新的大量信息流,以至于脸谱网认为这些信息需要进行剪辑、编辑、收藏,并且将你收到的信息进行过滤,达到一个更加容易管理的状态。你并不会看到你的朋友发布出的所有信息。哪一个已经被筛掉了呢?根据什么标准呢?只有脸谱网自己知道,而且他们将这个算法视为商业机密。至于他们优化的目的是什么,则没有人知道,甚至也没有与用户进行过交流。他们说是要提升用户的满意度,但还有一个更为合理的意图猜测,即他们之所以过滤你的信息流,是为了优化你花在脸谱网上的时间——相比你的幸福感,这是一个更容易测量的事情。但这可能又不是你希望脸谱网所优化的。
亚马逊会使用过滤器来优化销售方式以便实现销售额最大化,而且过滤的内容包括你在网页上看到的所有内容。不仅是对推荐什么商品进行过滤,对于网页上出现的其他素材也会进行过滤,比如特价商品、提供商、商品信息、用户反馈。同脸谱网一样,亚马逊在一天的时间里也会进行数千个实验,将他们的过滤器进行调整以比较两件商品的销售数据,尝试根据数百万消费者的实际使用反馈将网页内容进行个性化定制。他们轻微改动、细微调整,而在如此大的一个范围内开展实验(同一时间有着10万人的数据样本),使得他们的结果变得极其实用。在亚马逊这一过滤系统下,我成了它的回头客。因为亚马逊在尝试着优化的东西与我的目标类似——以优惠的价格获得我喜欢的东西。两者的战线并不会总是一致,但当一致的时候,我们就会购物。
谷歌是世界上最主要的过滤器,它会对你看到的搜索结果进行各种复杂的判断。除了对网页进行过滤,他们一天内还要对350亿封电子邮件进行处理,有效地将垃圾邮件过滤掉,并为邮件分配标签和优先级。谷歌是世界上最大的协同过滤器,它有着数千个独立的动态“筛子”(sieve)。如果选择加入他们的服务体系,他们会为你提供个性化的搜索结果,并根据你提问时的地点为你定制搜索结果。他们利用的是已经被证明行之有效的协同过滤规则,即人们在发现一个有价值的答案的同时,也会发现下一个答案同样不错(虽然他们不会这样标记它)。谷歌每分钟都会对网络上60万亿个网页的内容过滤200万次,但我们通常不会询问他们是如何做推荐的。当我发起一次查询时,他们是应该给我展示最流行的选项,还是最可靠的选项或最独特的选项,又或者是最可能让我满意的选项?我不知道。我对自己说,我可能会希望将选项按照四种不同的方式都排列来看一看,但谷歌知道我可能做的只是看头几个答案,然后点选。所以他们说,这就是我们认为最好的头几个,依据的是我们通过每天30亿次的在线回答总结出的深度经验。所以,我点击了。他们在尝试将机率最优化,那个机率就是我再次回来向他们提问的可能性。
随着它们的成熟,过滤系统将会延伸到媒体以外的其他去中心化的系统中,比如优步和airbnb。当你在预订住处的时候,你对于风格、价位和服务的个人偏好可以很简单地传达到另一个系统,使得你可以在威尼斯匹配到最合适的房间以提升你对服务的满意度。更深层的智能化意味着异乎寻常聪明的过滤器可以应用到任意一个需要进行大量选择的领域——这将涉及到众多领域。而在任何一个我们想要个性化定制的领域,过滤器服务都将会出现。
20年前,一些权威专家就期盼着大规模个性化定制能立即出现。在1992年约瑟夫· 佩恩(joseph pine)写作的《大规模定制》(mass customization)一书中,这类计划就已经开始展露倪端。曾经专供权贵的定制产品借助合理的技术进而推广到中产阶级,这一点看似合情合理。例如,一个由数字扫描和柔性生产 [2] 构成的精妙系统可以为中产阶级提供个人定做的衬衫,而不仅仅是只为上流人士提供此类定制产品。20个世纪90年代末期,一些创业公司尝试针对牛仔裤、衬衫、洋娃娃开展“大规模定制”,但这些尝试并没有能够推广开来。制约其发展的主要障碍在于,除去那些不重要的方面(比如颜色的选择或者长度的选择),想要在不将产品价格提升到奢侈水平的同时,还要获得或生产具有明显独特性的产品是非常困难的。当时的美好愿景远远超出了当时的科技水平。但现在科技水平已经迎头赶上。最新一代的机器人可以担负灵活制造的任务,而先进的3d打印机也可以快速打印出多套产品。无所不在的信息追踪、信息交互和信息过滤意味着我们可以以优惠的价格将我们自身多个方面的信息整合成用户档案,这一档案可以引导开展任何我们想要的定制服务。在数字前沿,谷歌已经提供大规模定制。未来的30年中,我们在教育、运输、医疗和零售领域都能看到大规模定制的出现。
下面这幅图景便展示出这一力量将带领我们走向何处。在不久的将来,我的一天将会以这种常规方式进行:在我的厨房里有个药丸制造机,比烤面包机小一点儿。它里面存放着几十个小瓶子,每个瓶子里面都以粉末形式储存一种处方药或营养成分。每天这个机器会把所有的粉末以合适的剂量进行混合,然后填充到一个(或两个)定制药丸里,供我服用。在这一天里,我身体里的重要器官都会受到可穿戴设备的传感器追踪,以便每个小时都对药物的效果进行测量,并将结果发送到云端进行分析。第二天的药物剂量会根据前一天24小时的结果进行调整,并生产出一个新的定制药丸。这一过程在随后的每天都会重复。已经有几百万台这样的装置被制作出来,并生产出大量的个人化药物。
我的个人化身储存在网络上,每个零售商都可以获取它的信息。它储存着我身体每个部分、每个曲线的准确测量数据。即使我要去一家实体零售店,在去之前也仍然会在家中一个虚拟试衣间里尝试每个商品,这是因为商店里只有商品最基本款的颜色和设计。借助虚拟镜子,我可以在查看衣服穿在我身上的效果时看到逼真程度令人惊奇的真实写照;实际上,由于我可以转动穿着衣服的虚拟化身,其效果要比试衣间里的镜子更有说服力。(它可以更好地预测新衣服穿在身上的舒适度。)我的衣服会根据我的化身提供的具体参数(随时间变化而修正)进行定制。我的服装服务会产生一些新风格的变式,而这些改变依据的是我过去的穿着,我花最多时间凝视过的衣服,或者是我最亲密的朋友已经穿过的衣服。这些都是过滤后的风格。几年以来,我已经培养出一个完全贴合我行为的档案,使得我可以在任何我想做的事情上应用它。
我的档案跟我的化身一样,都由“universal you” [3] 管理。这个档案知道我在度假旅行时喜欢预定便宜的旅社,但又要有私人浴室和最大的网络带宽,而且永远都要在城镇中最老旧的地区,否则就要紧靠公交车站。它还会与一个人工智能系统配合,为我安排行程,预计最佳的货币兑换汇率。它远非仅仅是一个储存信息的档案,更是一个不停运作的过滤器,会不断地根据我已经去过的地方、我过去旅行中发布的快照和推特种类来做出调整适应,它还会对我阅读、看电影时的兴趣点进行权衡比较,因为书籍和电影通常是旅行欲望的一个来源。它还会投入大量的精力分析我最好的朋友与他们朋友的旅行经历,并借助这一巨大的数据库时常向我推荐某些值得拜访的餐厅和旅社。对于它的推荐,我通常比较满意。
因为我的朋友会让“universal you”追踪记录他们的购物、外出就餐、聚会出席、电影观看、新闻浏览、日常锻炼、周末郊游等活动,这样无需朋友们花费多少精力,它就会给我做出十分详细的推荐。当我早上醒来时,universal会对我接收的更新信息流进行过滤,只向我发送那些我早晨喜欢接收的最重要信息。它过滤的依据是我常常转发给他人的信息类型,抑或是书签或者答复。我在橱柜里发现了一种营养丰富的新型谷物食品——因为我的朋友这周在尝试这个,所以universal you昨天为我预定了一份,尝起来还不错。我的汽车服务系统向我通报今天早上哪里出现了交通拥堵,所以它把我的汽车预约时间调晚了一点,而且还尝试另一条非常规线路送我到今天上班的地方,而这个线路是根据较早出门的几个同事提供的路线制定的。我一直不能确切知道我的办公室会在哪里,因为我们创业公司的会面地点取决于当天可用的合伙办公地点在哪里。我的个人设备会将办公地的屏幕转换成我使用的屏幕。这一天我的工作是对几个人工智能系统进行校正,这些系统的工作是将医生、治疗方式与客户进行匹配。我的工作则是帮这些系统理解一些特殊情况(比如有些人倾向信仰疗法),以便提升人工智能诊断和推荐的有效性。
当我到家后,我特别期望看到阿尔伯特为我准备的一系列有趣的3d视频和趣味游戏。阿尔伯特,这是我为universal中我的化身取的名字,它负责为我过滤媒体信息。阿尔伯特总能为我提供最酷的东西,因为我已经把它培训的很好了。自从高中起,我每天至少花10分钟来校正他的选择,并添加一些难以言明的影响来精细地调整这一过滤系统,所以在所有的新型人工智能算法和朋友的朋友的评分中,我找到了最喜欢的频道。有很多人在追随着阿尔伯特的选择进行日常活动。我处在虚拟世界过滤器排行榜的前几名。我的过滤方式非常流行,以至于我能还从universal中得到一些金钱回报——起码够我支付我在其中的所有订阅服务费用。
就如何过滤和该过滤什么而言,我们还处在初级阶段。未来的发展空间要比单纯地“我们过滤和我们被过滤”要广阔得多。这些强大的计算技术可以并且也将运用到万物联网的各个领域。即使是最不重要的产品或服务,只要我们想(但有时我们并不想),都可以进行个性化定制。在未来的30年,整个云端都会被过滤,以便提升个性化的程度。
每个过滤器都会过滤掉一些好的东西。审查也是一种过滤。政府可以通过植入国家层面的过滤器来移除不希望出现的政治观点,并严禁相关言论。就像脸谱网或者谷歌,他们基本上不会揭露他们过滤掉了什么。然与社交媒体不同,公民们并没有可供选择进入的替代路径。即使最初出于善意设计的过滤系统,我们也只能看到那可供浏览的宏大世界中的一小部分。这就是“后稀缺”(post-scarcity)世界的诅咒:我们只能与宏大世界中的一小部分建立连接。每天那些友好的制造技术——3d打印、手机app和云服务,都在充满可能性的世界拓展出新的方向。所以,每天我们都需要借助更为扩大的过滤器将丰富的信息以适合人类的尺度进行过滤后再获取。过滤器发挥的作用是不可或缺的。一个过滤器的不足不能通过将过滤器移除来弥补,而只能通过施加其上的互补性过滤器来修正。
从人类视角看,一个过滤器关注的是内容。但如果反过来,从内容的视角看,一个过滤器关注的是人类的注意力。内容扩张得越多,就需要更多的注意力聚焦。早在1971年,赫伯特·西蒙(herbert simon)这位获得过诺贝尔奖的社会科学家就总结出这样的观点:“在一个信息丰富的世界,大量的信息内容意味着某种东西的缺乏:无论它是什么,肯定是因信息消耗引起的缺乏。而大量的信息消耗的是什么,这是显而易见的:它消耗的是信息接收者的注意力。因此信息的丰富促成了注意力的缺乏。”西蒙的这一见解通常被简化为:“在信息丰富的世界里,唯一稀缺的资源就是人类的注意力。”
我们的注意力是唯一有价值的资源,是我们每个人无需训练就能产出的资源。它的供应是短缺的,每个人都想多要一些。你可以完全停止睡眠,但你每天仍然只是有24小时的潜在注意力,而且绝对不存在任何东西——无论是金钱还是技术——能增加它的总量。潜在注意力的最大值是已经固定了的。它的产出是既定有限的,然而除此以外的其他东西都在变得越来越丰富。既然它是最后的稀缺资源,那么注意力流向哪里,金钱就跟到哪里。
尽管它是那么珍贵,我们的注意力却又相当廉价。因为从程度上讲,我们每天不得不把它花掉。我们无法节省它,也无法将其贮存起来。我们不得不一秒一秒地把它交出,一刻不得停歇。
在美国,电视仍然占据了人们大部分的注意力,其次是广播,再其次是网络。这三者占据了我们注意力的绝大部分,而其他东西——书籍、报纸、杂志、音乐、家庭录像、游戏等,只占据了我们全部注意力中的一小部分碎片。
然而,并不是所有的注意力都是等价的。在广告行业,注意力的质量通常以一个名为cpm(cost per thousand,m为thousand的拉丁语标示,即每千人成本)的指标来反映,这代表一千个人的浏览,或者是一千个读者、一千个听众。各种媒体平台的平均cpm估计值有着广泛的差异。廉价的户外宣传栏cpm的平均成本为3.5美元,电视是7美元,杂志为14美元,报纸为32.5美元。
还有另一种方式可以计算出我们注意力的价值是多少。当我将每个主流媒体行业内的年度收入进行逐个结算求和后,便计算出每个行业每小时的注意力能产生多少收益(单位为“美元每小时”),结果令我震惊。
首先,这些结果的数值相当小。就企业挣得的美元与消费者花费的每小时注意力的比值而言,注意力对于媒体行业而言并没有多少价值。每年有将近5000亿个小时投入到电视节目中(这还只是美国的数据),然而对于看电视节目的所有人而言,平均来看每小时只产生了20美分的收益!如果你被以这个价格雇佣来看电视节目,你的收入只能算是第三世界国家的小时工资水平,基本上与被雇佣做苦力的人差不多。看电视节目是个苦力活。报纸占据了我们注意力中更小的一部分,但就所花的时间而言却产出了更多的每小时收益,大约是93美分每小时。相对而言,互联网有着更高的收益回报,每年都在提升注意力的质量,平均来看每小时注意力产生3.6美元的收益。
无论是我们为电视节目公司“挣得”的那可怜的价值20美分的每小时注意力,还是稍微高级一点的报刊上价值1美元的一小时注意力,都反映出了我称之为“商品注意力”的价值。就那些易于复制、易于传播、几乎无处不在,并且无时不在的日用商品而言,我们花在上面的注意力基本没什么价值可言。当我们考察我们为商品内容——所有的内容都是易于复制的,比如书籍、电影、音乐、新闻,等等——所不得不支出的费用时,这个比率是相对较高的,但这仍然不能反映出我们先前总结的观点,即我们的注意力是最后的稀缺资源。以一本书为例,精装图书需要花4.3小时读完,23美元购买。因此,消费者在阅读时平均的花费为5.34美元每小时。一张音乐cd通常会被听很多次,所以需将它的零售价格除以总共的聆听时间才能获得它的每小时费用。电影院中一部两小时的电影只能看一次,所以它的每小时费用就是票价的一半。这些比率可以视作一面镜子,借此反映出我们作为观众时,对我们的注意力赋予多少的价值。
1995年,我计算了各种媒体平台的每小时平均费用,包括音乐、书籍、报纸、电影以及正在热销的新产品——虚拟现实座驾(一种虚拟现实的体验)。不同媒体之间有着差异,但价格基本处于同一个数量级上。引人注目的一点是,各个媒体的价格基本围绕着相对平均的2美元每小时波动。也就是说平均来看,在1995年我们倾向于每小时支出2美元花在媒体使用上。
在15年之后的2010年以及2015年,我都再次用相同的方法对与之前类似的一组媒体行业的价值进行了计算。当我根据通货膨胀进行调整并换算成2015年美元的价值后,平均值分别是3.08美元、2.69美元、3.37美元。这意味着20年来,我们注意力的价值是相当稳定的。这样看来,我们似乎对某种媒体“值得”花费多少金钱有种直观的感觉,而且我们付出的成本不会有太多偏差。这还意味着,依靠我们的注意力赚钱的企业(比如那些引入注目的科技公司)也只是平均每小时获取3美元的收益——如果他们包含高质量内容的话。
数万亿小时的对于商品的低级注意力推动了我们经济的绝大部分,以及互联网经济的一多半。单纯的一小时并没有多少价值,但汇聚成整体后的力量则能够以排山倒海之势创造奇迹。对于商品的注意力就像一阵风,或是一波海浪,它是必须借助大型设备才能俘获利用的一种不均匀的力量。
谷歌、脸谱网的光芒夺目,以及其他网络平台的空前繁荣,都源于它们有着大量的基础设施负责过滤这些对于商品的注意力。平台利用强大的计算能力将不断扩张的广告商们与不断增长的消费者群体进行匹配。它们的人工智能系统会寻求在最理想的位置、最理想的时间插放最理想的广告,并且以最理想的方式、最理想的频率做出反馈。虽然有时这也被称为个性化定制广告,但事实上其过程远比仅仅将广告推送给个人更为复杂。这象征着一种过滤性的生态系统,除了做广告,还会收集结果反馈。
任何人只需填写一份网上表格,就可以注册为谷歌的广告供应商。(大多数广告只是文本形式,类似一种分类广告。)这意味着潜在的广告商数量可能有数十亿。你可以成为一个小商人,向素食主义的背包客推销一本烹饪书,或者推销你发明的一款新式棒球手套。在这个供应链的另一端,任何人无论出于什么目的运行着一个网页,都可以在其上面刊登广告,而且还可能从广告中获取收益。这样的网页既可以是一个私人博客,也可以是一个公司的网站主页。近8年来,我都在自己的私人博客上投放谷歌adsense [4] 广告。每个月我都能通过投放这些广告获得100美元报酬,这点报酬对于数十亿美元的企业而言微不足道,而且这种小规模的信息处理无需谷歌操心,因为这基本是全自动化的。adsense欢迎所有人加入,无论其规模有多小,所以一个广告潜在的投放位置有数十亿个。为了测试配对这数十亿种可能性——有数百万人想要发广告,也有数百万人愿意接收广告,需要进行求解运算的次数会达到天文数量。另外,最佳的安排还会随着每天中不同的时间或不同的地理位置而进行变化,所以谷歌(也包括其他搜索引擎公司,如微软和雅虎)有着大量的云计算机负责对这些信息进行分类。
为了实现广告商与阅读者的匹配,一天中的24小时里谷歌的计算机都不停地在网络上漫游,并收集网络上数十亿网页中每个网页上所有的内容,最终将这些信息储存到它巨大的数据库中。这就是谷歌可以在无论你何时向它发问,它都立即给你答案的原理。它已经把网络中每个单词、每个词语,以及每个事实的位置都建立了索引。所以当有一个网页拥有者想要在他的博客网页上插播一小条相关广告时,谷歌会从数据库中调出记录以查明这个网页上都出现过哪些内容,然后利用它的超级大脑去寻找一批人——几乎同时,他们想要投放与网页内容相关的广告。当匹配成功后,网页上的广告就会出现在网页的可编辑内容区里。假设这样的网站归属于一个小镇棒球队,那么一个创新型棒球手套的广告将会尤其符合网站的整体内容。相比投放一条浮潜工具广告,这个棒球手套广告更有可能获得读者的点击。所以,谷歌根据网站内容的前后关系,将会在棒球队网站上插播棒球手套广告。
但这只是复杂配对的开始,因为谷歌会尝试进行三方符合的匹配。理想情况下,广告不仅匹配网页中的前后内容,还要符合网页访问者的兴趣。如果你访问一个综合性新闻网站,比n(美国有线电视新闻网),而它知道你在为一个棒球队效力,那么你就可能看到更多的运动装备广告,而非家具广告。它是如何对你有所了解的?大多数人都不知道的一点是,当你访问一个网站时,你是随身携带着一些无形的符号一起到来的,这些符号会表明你刚刚从哪里出来。这些符号(技术名称为cookie)不仅可以被你刚刚开始访问的网站所读取,还能被一些大的平台读取,比如谷歌,这些平台的触角已经遍及整个网络。因为几乎每个商业性网站都使用谷歌的产品,那么谷歌就可以在你访问一个又一个网页时追踪你的路径,这一过程贯穿整个网络。当然,如果你在谷歌上查询过什么信息,它也可以同样地由此信息来追踪你。虽然谷歌还不知道你的姓名、地址,或者电子邮件(就目前而言),但它确实记住了你的网络行为。所以在你抵达一个新闻网站之前,如果访问过一个棒球队网页,或者搜索了“棒球手套”,它就会做出一些假设。它利用这些假设,并将假设添加到计算公式里,以便算出在你刚刚抵达的网页上应该插播哪种类型的广告。这看起来很像魔法,但你今天在网站上看到的广告在你抵达那里之前都是还没有添加上的。因而谷歌和新闻网站将会快速挑选你看到的广告,以保证你看到一个与我看到的完全不同的广告。如果整个过滤器生态系统正常运作,那么你看到的广告将会反映出你最近的网络浏览历史,而且会更符合你的兴趣。
但是等一下,还有更多的呢!谷歌自身在这样一个多边市场里成为了第四方。除了满足广告商、网页发布者、读者,谷歌也要尝试将他们的自身利益最大化。对广告商而言,有些观众的注意力要比其他人更有价值。健康类相关网站的读者就是更有价值的,因为他们可能会在很长一段时间里花费大量的钱财用于药物和治疗,而一个徒步俱乐部论坛的读者只会偶尔买些鞋子。所以每个广告的位置摆放后面都隐含着一个极为复杂的拍卖过程,即将关键词的价值(“哮喘”的价格要比“散步”的价格多很多)与广告商愿意支付的费用,以及读者真正点击广告的表现水平进行联合匹配。如果有人点击了广告,那么广告商会向网页所有人(还包括谷歌)支付几美分的报酬,所以算法会尝试将广告位置、被点击的比率、支出费用进行最优化调节。获得12次点击的一条5美分的棒球手套广告要比只获得1次点击的一条65美分的哮喘呼吸器广告更有价值。但是如果第二天,棒球队博客上贴出了一个关于今年春天有大量花粉飘散的警告,那么在棒球队博客上插播呼吸器的广告价格就会突然涨到85美分。为了在一小时里设定最佳的广告安排,谷歌可能要同时处理数十亿个因素,并且要实时处理。当每件事都以这种流动的四方匹配形式运作时,谷歌的收入也达到最大化。在2014年,谷歌总收入中的21%,或者说140亿美元,是来源于这种相关广告系统的。
不同类型的注意力相互作用,形成了一个十分复杂的生态系统,而这一生态系统在2000年之前是难以想象出来的。用于追踪、分类并过滤每个维度信息的智能化程度和计算能力已经超出了应用范围。但随着追踪、知化、过滤构成的系统不断发展,有越来越多可行的方式可以用来分配注意力——包括支出和接收。这样一个时期类似于寒武纪的生物进化时期,当时出现了大量多细胞形式的生命。在一个很短的时期(就地质角度而言),生命出现了一些从未有过、从未尝试的可能形式。那个时期突然出现了大量新的——有时是略显奇怪的——生命组织形式,以至于我们将那一时期的生物创新称为“寒武纪生命大爆发”(cambrian explosion)。随着各种新奇古怪类型的注意力、过滤器在进行各种尝试,现在我们的注意力科技也处在类似“寒武纪大爆发”的一个变革窗口期,例如,如果广告业像其他商业领域一样推进去中心化这一趋势会怎样呢?如果由消费者创造广告、投放广告、支付广告费用,会怎样呢?
下面让我们以一种方法来思考下这种新奇的安排方式。每个依靠广告维持的企业——现在大多数互联网企业都属于此行列,都需要说服广告商将其广告专门投放在他们的渠道上。发行商、会议举办方、博客博主或者平台运营者提出的论点通常是,没有人能像他们那样将信息传达给某个特定的客户群体,或者像他们那样与客户群体有着良好关系。广告商握有资金,所以他们会挑剔地选择谁来运营他们的广告。而一个发行商要努力地劝说讨好那最令人喜欢的广告商,发行商没有权利选择运营哪个广告。但广告商,或者他们的代理人是有权选择的。一个充斥着广告的杂志,或是填满商业广告的电视节目还常常认为他们自己是幸运的,因为他们被选中作为运营广告的载体。
但如果任何一个有自己粉丝群体的人可以自主选择他们想要展示的某个广告,无需再申请许可,会是怎样的情景呢?比如你看到了一个关于跑鞋的非常酷的商业广告,而你想将它收录到你的信息渠道,而且像电视台一样为此得到一定报酬。如果任何一个平台都可以仅仅收集那些它们感兴趣的最佳广告,然后通过投放这样的广告而获取利润,而利润多少的参考依据是它们给这个广告带来的观众数量和观众质量,这又是怎样的情景呢?视频、静态图像、音频文件,无论广告的载体形式如何,都可以在其中嵌入代码以追踪广告在哪里播放过、被浏览了多少次,这样无论广告被复制传播了多少次,广告的投放者都能获得报酬。一个广告所能遇到的最好事情就是像病毒一样扩散,在尽可能多的平台上插播并且循环播放。而由于你的网页上的一个广告可以给你带来收入,你将会努力寻找令人印象深刻的广告来投放。设想在pinterest上有个专门收集广告的板块。收藏夹里的任何一个广告,只要被读者播放或浏览过,都可以为收藏者带来收益。如果操作得当,观众们来到这里可能都不再是为了什么酷炫内容,而只是为了那酷炫的广告——正如同有几百万人坐在电视前看“超级碗” [5] ,其中有很大一部分人是去看广告的。
结果就是出现一个平台,它将广告视同内容。编辑会花大量时间搜寻不为人知的、很少有人看过的、吸引眼球的广告,正如同他们会花大量时间寻找新文章一样。然而,广泛流行的广告可能无法像小众广告那样有较高的回报。那些讨厌的广告可能要比搞笑的广告带来更多收益。所以存在一种权衡,是选择看起来很酷但不怎么赚钱的广告,还是平淡无奇但有利润的广告。另外,那些既有趣又有收益的广告很有可能已经有过大量的曝光了,这样既降低了他们的奇酷感,也可能降低了它们的价格。可能会出现一些杂志、出版物、在线网站,它们没有什么内容,有的只是精心编排的广告——那些会带来收益的广告。现在就已经有这样一些网站,它们专门呈现电影预告片或精彩的商业广告,但它们还未因呈现这些材料而从制作人那里获取报酬。但用不了多久,它们终将实现盈利。
这样的安排完全颠覆了业已建立的广告产业利益链条。就像优步和其他去中心化系统一样,这样的改变使得曾经由少量专业人士执行的高度精细化的工作可以对外开放,并且可以在由业余爱好者构成的点对点网络中开展执行。在2016年,广告行业的专业人士中没有人相信这一转变可以发挥作用,甚至但凡有点理性的人都会认为这很疯狂,但对于未来30年的变化,我们有一点是明确的,那就是看似不可能的事情可以由巧妙连接起来的爱好者同盟来完成。
2016年,一些特立独行的新兴公司将尝试打破现行的注意力系统,但在推出一些变革的新模式之前,可能还需要大量尝试。在这一幻想与现实之间阻碍发展的因素就是技术的欠缺,我们需要一种技术来追踪一个复制后的广告得到的浏览次数,并对其得到的关注进行量化,然后将这些数据安全地进行交换,以便确保正确地支付费用。对于谷歌或者脸谱网这样的大型多边平台而言,这是一个复杂的计算过程。这一过程需要大量的监管,因为由此产生的金钱会吸引骗子和富有创新的垃圾邮件制造者进来作弊。但是一旦这样的系统得以建立并顺利运行,广告商就可以将广告以病毒迅速传播的形式扩散到网络上。你可以找到一个广告,将它嵌入到你的站点里,这样,如果有读者点击它,就会触发一次付款。
这种新体制将广告商置于一个奇特的位置。广告创造者不再有能力控制一个广告投放的地点。这种不确定性需要以某种方式进行代偿,即广告的组成类型。有些广告的设计应旨在快速复制传播,并引发观看者的直接行动(购买)。其他广告则可以设计成纪念碑似的停留在原地,不会移动,并且慢慢塑造品牌影响。理论上看,一个广告可以当作一个社会评价,那么它就可以像社会评论素材一样处理。并不是所有的广告都会放任自流。有些广告——可能不是很多,可能还是要继续用于传统渠道的直接投放(使得他们不那么流行)。这种系统的成功仅是在传统广告模式上锦上添花,但也要凌驾传统模式之上。
去中心化的潮流席卷了每个角落。如果业余爱好者可以制作广告,那么为什么消费者和粉丝们不也来创造他们自己的广告?科技可能已经足以支持一个点对点的广告创造网络了。
有些公司已经开始尝试使用一些用户创造的广告版本。多力多滋 [6] 曾经在消费者中公开征集广告短片,用于在2006年的“超级碗”比赛中播放。他们收到了2000个广告短片,并且有至少200万人参与投票选出用于投放的最佳短片。从那时起,他们每年平均会收到5000个用户制作的广告提案。他们会给最佳广告的创作人奖励100万美元,而这要比找人设计专业的广告所支出的费用少得多。在2006年,通用汽车为它的雪佛兰tahoe这款suv车征集用户制作的广告,并收集到了21000个提案(另外4000个是抱怨suv的负面广告)。但这些例子是有局限的,因为最终投放市场的那条广告必须经过公司领导的审批和再加工,并不是真正的对等网络工作模式。
一个完全去中心化的、对等网络的、用户制作的众筹广告网络将会允许用户创作广告,然后让作为发行方的用户来决定他们想让哪一个广告放置在他们的网站上。那些确实带来点击量的用户制作的广告将会被保留、分享。那些无效的则会被舍弃。用户成为了广告代理人,同时他们也是承包一切事务的人。就像有爱好者将他们的生活写真照片库或是工作片段涂鸦放到ebay上拍卖,那么也必然会有些人依靠大量炮制各种变式广告来谋生,偿还房屋贷款。
我的意思是,你到底想让谁来制作你的广告?你是想雇用昂贵的工作室,让其利用其最佳猜测来构想一个活动方案,还是找1000个富有创造力的孩子,让他们不断调整、测试他们为你产品制作的广告?但如往常一样,大众总是要面临一个两难困境:他们是应该为一个可靠的畅销商品制作广告,并怀着同样的想法去改善另外1000个商品,还是到长尾理论的那一端,去接受一个你自己可能都不完全了解、也不确定是否有效的产品?产品的粉丝会乐于为它创作广告。自然而然地,他们也认为没有人像他们一样了解产品,并且现在的广告(如果有的话)是很差劲的,所以他们很有信心、也很愿意更好地完成这份工作。
期望大公司将他们的广告“撒手不管”,有多大的可能性?没多少可能。大公司是不会率先尝试这种模式的。这需要一些性急的新公司花几年的时间才能搞清楚明确发展方向,因为他们几乎没有多少广告预算,也不怕失去什么,才会敢于尝试。就像相关广告一样,大公司并不是此类业务的主要参与者。所以不如说这种广告领域的新模式是将小人物放大,让他们跻身中间层接触到价值数十亿的商业领域,这是他们从未设想过的,更是从未有机会接触的,进而推动起一场炫酷的广告运动。借助对等网络系统,这些广告将会由热情的(也是贪婪的)用户来创造,然后病毒式地传播到博客荒野里,在那里通过不断测试、再设计直到有效发挥作用,一个广告逐渐进化成最佳广告。
通过追踪注意力的替代模式,我们可以看到注意力还有一些未曾开发的组织形式。艾瑟·戴森(esther dyson)是一位早期的网络先驱和投资人,她长期抱怨电子邮件沟通引发的注意力不对称。因为她在互联网管理形式上积极参与,并且积极投资一些创新的新兴公司,她的收件箱里充斥着各种她不知道的人发来的邮件。她说:“电子邮件这样的系统,使得他人可以向我的待办事项中随意添加事件。”现在也是这样,基本无需花什么费用就可以向其他人的事件列表中添加一封邮件。20年前,她提出构建一个系统,使她可以在阅读他人邮件时向发件人索取报酬。邮件发件人需要支付一小笔费用,而价格是由信息的接收者来制定,比如艾瑟。收件人可以向某些人收取较少的费用(25美分),比如学生,或者针对公关公司发来的新闻稿收取较多的费用(2美元)。朋友和家人可能就免收费用,但来自一个企业家的复杂难懂的投件可能需要5美元的费用。如果一个邮件被阅读了,费用也可以以追溯形式免除。当然,艾瑟作为一个颇受欢迎的投资人,她的默认过滤值可能会设置的高一些,比如每封需她阅读的邮件要征收3美元。一个普通人可能无法索取同样的费用,但任何价格的费用征收都可以充当一个过滤器。更为重要的是,适当地征收阅读费用也可以作为对接收者的一个提醒,即发件人认为这个邮件是“重要的”。
收件人即使不像艾瑟那样有名,也值得为其阅读邮件索取报酬。他们可以是一个小群体的影响者。云端的一个极其强大的应用就在于捋清追随者和被追随者之间繁乱的网络关系。大量的计算识别可以追查清楚每一个影响者与被影响者之间的排列关系。如果一个人可以影响一小部分人,而这一小部分人还可以影响其他人,而另一个人能够影响很多人,但这些人却并不能影响其他人,这样的两个人的等级排列是不一样的。这里的地位是十分局部化的、具体的。如果一个少女有着众多忠实的朋友追随她的潮流引导,那么她的影响力等级要比一个科技公司的ceo高得多。这种关系网络的分析可以深入到第三层和第四层(朋友的朋友的朋友),但同时也伴随着计算复杂性的急剧增长。这种不同复杂程度导出的分数可以根据影响力程度和注意力等级进行分配。一个高分者可以在阅读一封邮件时索取更高的费用,但他也可能选择根据发件人的分数来调整征收的费用——这就使得计算总费用时计算的复杂性和成本支出增加了。
这种直接向他人的注意力支付报酬的原则也可以拓展到广告领域。通常我们免费地将我们的注意力花在广告上。为什么我们不向公司征收观看他们广告的费用呢?就像艾瑟设定的框架一样,不同的人可以根据广告的来源索取不同的费用。而且对于销售商而言,不同的人有着不同的“吸引力价值”。有那么一部分观众有着更大的价值。零售商会考虑一个消费者的开销总寿命期,根据他们的预测,如果一个消费者在其一生中可能在他们的商店里花费10000美元,那么这个人就更值得尽早获得一张200美元的打折券。一个消费者也同样有着影响力总寿命期。他们的影响力会如涟漪般借由其自身的追随者向外传播,传递给追随者的追随者的追随者,诸如此类。那么这个总的影响程度就会累加计算,并根据他们的寿命期做出一个估计值。对于那些有着较高寿命期等级的吸引眼球的人,公司认为对他们直接进行报酬支付要比把钱给广告商更为划算。公司可以用现金或者贵重物品,又或者高价服务来支付报酬。实际上,这就是奥斯卡颁奖典礼上赠送幸运大礼包的根本目的。
在2015年,被提名者的大礼包里塞满了价值16.8万美元的商品,里面混杂着润唇膏、棒棒糖、旅行枕头这些消费品,以及豪华酒店和旅行的套票。销售商对奥斯卡提名者进行了合理的估算,认为他们是高影响力人群。这些接收礼包的人根本不需要这些东西,但他们很可能会向他们的粉丝唠叨。奥斯卡的事例很显然是个个例。但就小一点的尺度而言,当地小有名气的人也可以显著地获得大量追随者,并获得一个大小可观的影响力总寿命期分值。但直到前不久,想要在亿万人群中查找出各种小众名人仍然是不大可能的。而今天,过滤技术和共享媒体的发展进步,使得这些内行人士得以被发现,并成批量地发掘出来。与奥斯卡不同,零售商可以把目标集中到一个由小众影响者构成的巨大网络。以前做广告推行产品的公司可以把广告也省去了。他们可以将他们几百万美元的广告预算款项直接打到数万个小众影响者的账户上,用以换取他们的关注。
我们还没有探索过所有交换、管理注意力和影响力的可能方式。一个充满未知的大陆正在开启。一些最有意思的可能模式仍然还未出现。注意力的未来形式将脱胎于对有影响力的数据流的舞蹈式编排,而这种编排是可以追踪、过滤、共享和混合的。为了编排这一注意力的“舞蹈”,所需处理的信息规模也达到了更高级的复杂性。
相比5年前,我们的生活已经变得更为复杂。为了开展我们的工作、有效学习、当好父母,甚至是娱乐,我们都需要花精力处理更多渠道的信息。我们不得不考虑的因素数量、影响因子数、参数个数和可能性数量几乎每年都以指数级增长。因此,我们似乎要永久地处在分离状态,并且在一个个事物间不停辗转,但这并不是一个灾难的信号,而是对当前环境一种必然的适应。谷歌并不会将我们变傻,相反我们需要网上冲浪,需要敏捷反应,需要对下一个新事物保持警惕。我们的大脑还没进化到可以处理这无穷的信息量。这一领域超出了我们的自身能力,所以我们不得不依靠我们的机器来与这么大量的数据进行互动。我们需要一个实时的过滤系统嵌套,以便我们可以处理我们已经创造出的各种新增选项。
现在产品大量过剩,以至于对大量冗余产品进行过滤的需求在持续增加,而导致产品过剩的一个主要因素就是各种廉价物料交互影响。总体来看,随着时间的过去,科技技术基本上向免费方向发展,这就会促使产品大量过剩。乍听之下,很难理解技术为什么会是向免费方向发展。但对于我们制作的大多数东西而言,这就是不争的事实。随着时间的发展,如果一个技术持续研发应用得足够久,它的费用就会开始向零靠近(但绝不会达到)。在适宜的时间,任何一种技术性应用都好似是免费产品发挥作用。这一趋向免费的趋势对于食品、材料这种基本物品(通常被称为消费品)似乎是适用的,而且对于家用电器这种复杂的产品也是适用的,另外,同样也适用于服务和无形的东西。所有这些物品的费用(就每个固定单位而言)随着时间的流逝在一直下降,自工业革命以来尤其如此。在2002年国际货币基金组织发表的一份报告指出:“在过去的140年里,实体商品的价格呈现出下降趋势,大约是每年下降百分之一。”也就是说在一个半世纪以来,物价都在向零靠近。
这一趋势并不是只存在于电脑芯片和高科技产品领域。几乎是我们在每个行业制造的每件东西,都在沿着同一个经济发展方向前进,那就是每天都变得更加便宜。让我们举个例子,比如铜材料的费用下降。按照时间,将其向零靠近的价格趋势绘制成图。在它的价格继续向零靠近时,这个曲线会遵循一个数学模型。假设这个数学函数保持不变,那么它的价格永远不会达到完全免费的界限。可是,它的价格会稳定地向这个界限靠近后再靠近,进入到无穷无尽的狭窄缝隙里。这种向一个界限不断靠拢但又不会交叉的模式被称为接近渐近线。这里的价格不会是零,但实质上与零无异。通俗来讲,通常理解为“便宜到没法比较”——跟零靠得太近,甚至没法记录变化。
这也产生了一个巨大的问题:在一个充斥廉价品的时代,又有什么是真正有价值的?有些矛盾的是,我们对于商品的注意力并不怎么值钱。我们的猿猴大脑很容易被廉价产品劫持。在资源丰富的社会里仍然稀缺的是那种并非由商品派生或专注于商品的注意力。当所有商品的费用都在向零靠近时,唯一一件还在增加费用支出的事情就是人类的体验——这是无法被复制的。除体验以外的每样东西都在逐渐变得商品化,逐渐变得可以过滤掉。
高档的娱乐方式正在以每年6.5%的速度增长。音乐会门票的平均价格在1981年到2012年增长了近400%,远远超出了同期物价增长的150%。医疗保健的价格也出现了类似的增长,从1982年到2014年增长了400%。在美国,临时保姆的平均价格为15美元每小时,这是最低工资的两倍。在美国的一些大城市,父母们为了找人照顾孩子一晚上花100美元已是再正常不过的事了。针对身体体验进行独家细心照料的私人教练是近来快速发展的职业之一。在救济院,药物和治疗的费用在下降,然而家庭拜访(体验方面)的费用却在增加。婚礼的花费更是没有限制。这些都不是商品,它们都是体验。我们对它们投入了全身心的纯粹的注意力。这些体验是不能复制或者储存的。对于这些体验的创造者而言,我们的注意力是十分有价值的。人们在创造体验和消费体验上都十分擅长,这并不是巧合。就这一点而言,机器人毫无用武之地。如果你想了解当机器人接手了我们现在的工作之后,我们人类会做什么,那就看看这里。我们会将珍贵的、稀缺的注意力投入到体验上。这是我们将会把钱花出去的地方(因为体验不是免费的),也是我们将要挣钱的地方。我们将会利用技术来生产商品,为的是避免我们自己成为一件商品。
还有一件有趣的事情与这一系列用于提升体验并促进个性化的科学技术有关,那就是它们给我们施加了巨大的压力,以促使我们去弄清楚我们是谁。我们很快就要直接地居住在包含万物的图书馆中,周遭围绕着不断变化的事物,那是人类世界所有现存的各种各样的作品,它们都恰恰处在我们伸手可及之处,而且还是免费的。最大的过滤器将准备待命,默默地引导着我们,随时准备为我们的需求服务。过滤器会问,我们想要什么?你可以选择任何东西,你会选择什么?这些过滤器已经监视我们几年之久,它们能预期到我们将会问什么。它们几乎可以迅速地自动完成我们的要求。然而问题在于,我们并不知道我们想要什么。我们对自己并不是很了解。从某种程度上说,我们依赖过滤器来告诉我们自己想要什么。它们并不像是奴隶主,反而更像一面镜子。我们会听取由我们自身行为产生的建议和推荐,这是为了听一听、看一看我们自己是谁。在互联云里的几百万台服务器上运行着数亿行代码,它们在不停地过滤、过滤、过滤,帮助我们提取自身的独特点,优化我们的个性。人们担心技术会使我们变得越来越一致化、越来越商品化,但这种担心是不正确的。实际上,我们进行的个性化定制越多,对于过滤器而言处理起来越简单,因为我们会变得更为独特,有着一个它们可以处理加工的实质区别。经济依靠区别对待来运行。我们可以利用大量的过滤器,在明确我们是谁的同时,为我们自己进行个性化的定制。
进行更多的过滤是必然的,因为我们在不停地制造新东西。而在我们将要制造的新东西中,首要的一点就是创造新的方式来过滤信息和个性化定制,以突显我们之间的差异。
[1] 指主要依靠有高度柔性的以计算机数控机床为主的制造设备来实现多品种、小批量的生产方式。——译者注
[2] 指主要依靠有高度柔性的以计算机数控机床为主的制造设备来实现多品种、小批量的生产方式。——译者注
[3] 根据上下文的意思,universal指的应该是当事者所处的整个生活环境。而universal you指的是能在这个环境中进行综合判断的类似当事者化身的角色。——编者注
[4] adsense是由谷歌公司推出的针对网站主的互联网广告服务,它可以通过程序分析网站的内容,然后投放相关广告。——编者注
[5] 超级碗(superbowl),指美国橄榄球联盟的年度冠军赛。——译者注
[6] 多力多滋(doritos),美国著名的玉米片零食。——译者注
第8章 重混 remixing
纽约大学经济学家保罗·罗默(paul romer)专门研究经济增长理论,他认为真正可持续的经济增长并非源于新资源的发现和利用,而是源于将已有的资源重新安排后使其产生更大的价值。增长来源于重混。圣塔菲研究所的经济学家布莱恩·亚瑟(brain arthur)专门研究技术增长的动态过程,他认为“所有的新技术都源自已有技术的组合”。现代技术是早期原始技术经过重新安排和混合而成的合成品。既然我们可以将数百种简单技术与数十万种更为复杂的技术进行组合,那么就会有无数种可能的新技术,而它们都是重混的产物。适用于经济增长和技术增长的事实也适用于媒介增长。我们正处在一个盛产重混产品的时期。创新者将早期简单的媒介形式与后期复杂的媒介形式重新组合,产生出无数种新的媒介形式。新的媒介形式越多,我们就越能将它们重混成更多可能的更新型媒介形式。各种可能的组合以指数级增长,拓宽着文化领域和经济领域。
我们生活在新媒介的黄金时代。在过去的几十年里,诞生出的数百种新的媒介形式,都是由旧的形式重混而来。先前的媒介依然存在,比如,一篇报纸文章或者一段30分钟的电视情景喜剧,又或者一首4分钟长的流行歌曲,而且还广受大众喜爱。但数字技术将这些已有的形式分解成基本元素,使得它们能以新的方式重组。比如,一个网络列表类文章(清单体),或者一个140字的微博。有些重组的形式如今十分畅行,以至于可以被视为一种新的媒介形式。这些新的媒介形式自身将会被重混、分解,并在未来的几十年里重组成数百种其他的新形式。有的已经成为主流:它们吸纳了至少一百万创造者,并有着亿万受众。
例如,在每一本畅销书背后都有着庞大的粉丝团体,他们会沿用自己最喜欢的作者创造的角色,并对虚构世界稍加改动,续写他们自己的篇章。这种充满想象力的延伸式小说被称为同人小说。这种同人小说是非官方的——没有原作者的配合或许可,并且可能混合了不同作品或作者的元素。他们的主要受众是其他狂热的粉丝。一份同人小说档案迄今记录了150万个粉丝作品。
用手机快速记录下来的十分简短(6秒或更短)的视频剪片可以简便地用一款名为vine的app进行分享和再分享。6秒的时间已经足够讲个笑话或者展现一场灾难,并且让它们呈病毒式传播。这些简明记录的剪片也可以被深度编辑,以获得极致效果。由一系列6秒剪片构成的集锦是一种十分流行的观看模式。2013年,每天都有1200万个vine剪片发布在推特上,而在2015年,每天的观看次数达到15亿次。在vine上也有明星,他们有着数百万的粉丝。还有一种更为简短的视频类型。一张动态的gif图片看起来就像是一张静态图片围绕着一些小动作,一遍遍地循环播放。循环一次的时间只有一两秒,所以它也可以被视为一种一秒钟的视频。任何姿态动作都可以循环播放。一张gif图片可能是脸上的一个古怪表情在循环播放,或者是某个电影里的著名场景在无限循环,又或者是某种模式的重复。这种无休止的重复鼓励人们仔细研究里面的内容,直到解读出更高层次的意义。当然,很多网站都在致力于gif图片的推广。
这些例子只是暗示我们,各种新形式的媒介在未来几十年内会疯狂地爆发式增长。任取一种媒介形式进行大量生产,并将产物进行配对结合或者杂糅搀和,我们就可以看到可能出现的新媒介的早期轮廓。我们用手指就可以将电影中的素材拖拽出来,并重混到我们自己的照片中。在手机上轻敲一下,内置的摄像头就可以捕捉一个场景,并显示出它的相关信息,用作对这张图片的注释。文字、声音、动作,这些东西会继续互相融合。借助即将出现的新工具,我们将可以根据需要创建自己的想象画面。比如,枝叶上闪烁着露珠的宝石绿色玫瑰静静地躺在一个修长的金色花瓶里,制作一张这种景象的逼真可信的图像将只需几秒钟,甚至可能比我们写下这些文字的过程还要快。而这还只是故事的开始。
数字比特流最为重要的特性是可互换性,这使得不同形式的媒介可以轻易变换形式,产生变革,以及互相融合。快速流动的比特使得一个程序可以模仿其他程序。模仿另一种形式的能力是数字媒介自带的功能。这并不是对多样性的背弃。可供选择的媒介数量将只会增长。各种媒介形式及其子形式的数量会继续爆炸式增长。当然,有些会变得更加流行,而其他的则会衰退,但没有哪种形式会完全消失。一个世纪以后,仍然会有歌剧爱好者,同时会有多达十几亿的电子游戏粉丝以及亿万虚拟现实世界。
在未来的30年里,比特的持续流动将继续占据媒介领域,推动更为广泛的重混。
与此同时,廉价、普遍的创作工具(百万像素的手机摄像头,youtube capture,imovie软件)正迅速地减少着创作动态画面所需的努力,并且颠覆着各种媒介固有的不对称性。例如:读一本书要比写一本书简单得多;听一首歌要比创作一首歌简单得多;观看一场演出要比制作一场演出简单得多。尤其是篇幅较长的传统电影的创作者,更是长期承受着与用户之间投入的不对称。创作者需要小心翼翼地用化学药水处理电影胶片,并拼接成一部完整的电影,整个过程中需要大量人员密切协作,说明看电影比制作电影简单得多。一部好莱坞大片需要耗费多达一百万的工时,但消费它只要花两小时。专家们自信地宣称,观众绝不会从被动接受投向主动创作,但令他们彻底困惑的是,近几年来有数千万人花费了无数小时制作他们自己设计的电影。他们拥有数十亿潜在的观众群,并且可以选择创作多种不同类型的影片。借助新型的消费者工具,社区培训,同伴鼓励,以及极其智能的软件,现在制作视频的便利程度与写作差不多。
当然,这并不是好莱坞制作电影的方式。一部大片相当于一件用户定制的巨型产品。就像是东北虎一样,它需要我们的关注,但同样十分稀有。每年,北美洲会展映600部电影,或者说1200小时的动态影像。相比现今每年生产出的亿万小时动态影像,1200小时所占的比例极其微小,几乎就是一个无关紧要的舍入误差。
我们通常以老虎来指代动物王国,但事实上,蚱蜢才是真正具有代表意义的动物。细致手工打磨的好莱坞电影就像是稀有的老虎,它并不会离开人们的视野,但如果我们想了解电影未来的发展,就需要研究在我们视野下方成群聚集的小生物——youtube、独立电影、电视剧、纪录片,以及如昆虫般体积小巧的超短剪片和混搭短片,而不能仅仅关注处在顶点的老虎。youtube上的视频一个月内的观看数量达120亿次以上。其中最流行的视频《江南style》,累计被观看了24亿次,远超任何一部大片。每天,上亿部拥有少量观众的视频短片被分享到网络上。如果仅就发行数量和这些视频获得的关注总量做评判的话,现在这些视频短片就是我们文化的中心。它们的制作工艺水平有着广泛的差异。有些短片的制作水平丝毫不逊于好莱坞电影,但大多数还是些小孩在他们的卧室里用手机拍摄的。如果说好莱坞是金字塔的顶点,那么底层才是滋生各种行动的地方,是开启动态影像未来的地方。
非好莱坞产品中的绝大多数是依靠重混制作的,因为重混的方式相较创造更简单。爱好者从网上寻找电影原声,或者自己在卧室里录制,然后将电影中的场景进行剪切或重组,键入文字,之后便展现出一个新的故事或者新的观点。其中,对广告的重混剪辑十分泛滥。针对于特定的媒体形式,爱好者通常会遵守一套固定的模式。
例如,重混电影预告片。电影预告片本身就是一种新近的艺术形式。因其本身的简洁和紧凑的叙事结构,电影预告片可以被方便地重新剪辑成另一个版本的故事——例如制作某虚构影片的预告片。一个不知名的爱好者可能会将一个喜剧剪辑成一个恐怖短片,或者相反。将预告片的声轨进行重混是混搭这些电影短片的常见方式。有些粉丝会创作音乐短片,他们将一首流行歌曲的声轨与剪辑好的小众邪典热门电影片段进行匹配并混缩。或者他们先剪辑出喜爱的电影或电影明星的场景片段,然后将其混搭进一首不太相关的歌曲。这些成了幻想世界的音乐短片。流行乐队的骨灰级粉丝会将他们喜欢的歌曲加在视频中,并赫然添加上大号字体的歌词。最后,这些歌词版视频变得十分流行,以至于一些乐队开始发布带有歌词的官方版mv。这些歌词在视频上浮动,并与声音同步,可以算是文字和图像的真正重混和结合——你可以“读”视频、“看”音乐。
视频的重混甚至可以发展成一种集体活动。全世界数十万(当然是在网上见面)的狂热动漫迷会将日本动画片进行重混。他们将动画片剪辑成细小的片段,有些片段只有几帧画面,然后利用视频编辑软件把这些片段进行重新编排,添加上新的声轨和音乐,通常再配上英语对白。这样的处理过程可能要比绘制原版动画所需的工作量更大,但比30年前创作一个简单短片所需的工作量少得多。新的动画视频会讲述一个完全不同的新故事。在这种亚文化中,真正的成就在于赢得“铁人编辑”(iron editor)挑战。与电视节目“铁人料理”(iron chef)这一烹饪比赛类似,“铁人编辑”竞赛者必须在观众面前互相竞争,当场进行视频的实时重混以彰显他们超强的视觉素养。最好的编辑重混视频的速度和打字一样快。
事实上,混搭的习惯正是借鉴自文字的交流表达。你在一页文章上进行词汇的剪切和粘贴。你会逐字逐句地引用一个专家说过的话。你将一种巧妙的表达方式进行转述。你在一些地方增加了些细节描述。你从一部作品中借鉴文章架构用于自己的创作。你将画面当作词句一样移动。你获得了一种新的视觉化语言。
过去是一股数据流,它被剪辑和重新编排成新的混搭事物。屏幕则永远面向新的事物,面向未来。
数字科技也为资深的电影从业人员提供了一种新的语言。一个图像会储存在一个记忆磁盘上而非赛璐璐制作的电影胶片上,由此带来的流动性使得这个图像可以像词汇一样被灵活运用,而非像照片一样被定格。像乔治·卢卡斯这样的好莱坞怪杰早早地就拥抱了数字技术(卢卡斯创立了皮克斯公司),并率先使用一种更为流畅的方式进行电影拍摄。在他的《星球大战》系列电影中,卢卡斯开创了一种新的电影拍摄方法,它与图书、绘画的创作有着更多的相似之处,而与传统电影拍摄手法则相去较远。
在传统的电影拍摄手法中,影片的拍摄计划依据场景制定,所有场景都会被拍摄(通常不止一次),通过重复大量使用这些场景,最终组合成一部电影。有时,如果可供使用的胶片不能很好地阐述故事,那么导演必须返回影棚,补拍一些镜头。然而,借助数字技术带来的新屏幕流动性,一个电影场景具有更大的可塑性:就像作者笔下的一个段落可以被反复修改。无需再去捕捉场景(就像是照相取景),而是逐步地叠加场景,就像绘画一样。只需向一个大致的动作框架上添加一层层的视觉、听觉细节素材,混合出的效果就可以不断变化,并且可以一直再进行修改。乔治·卢卡斯拍摄的《星球大战》系列电影中的最后一部就是以这种与作者创作类似的方式进行层层效果添加的。他在绿幕房间里拍摄了演员的动作,即“两名绝地武士挥舞长剑碰撞——没有背景”,然后在这个框架上铺垫上一个热闹集市的复杂场景,同时还有一些细小的视觉素材。光剑的效果和其他效果则是后期以数字形式一层一层绘制上去的。以这种方式,逼真的雨水、火焰和烟雾可以一层层地添加到一个粗略的框架上。这一过程的便利简洁就像是卢卡斯在写剧本时可能会写上一句“这是一个风雨交加的黑夜”。最终,电影中的每个画面几乎都以这种方式进行过修改。本质上,一部数字电影就是这样一个像素一个像素地“写”出来的。
2008年上映的电影《极速赛车手》(speed racer)是改编自原版动画的真人电影。这部电影虽然不是什么票房佳作,却将这种电影制作手法推进了一大步。电影中层叠出现的郊区场景就是借用一个数据库中的现有视觉素材创建的,利用这些素材分别组成场景的后景、中景,以及前景。粉色的花来源于一张照片;一辆自行车则取自另一个素材库;一个普通的屋顶又是取材于另外的一个素材库。计算机会负责其中最困难的工作,即无论这些素材是多么细小或不完整,甚至发生位移,计算机都要保持它们正确的透视关系和位置关系。这种手法应用的结果就是一部电影完全可以由一百万个已有的图像组合而成。在大多数电影中,这些素材片段是针对相应的项目进行专门手绘的,但就像《极速赛车手》中的情形一样,人们会在各种地方发现越来越多的这种素材,并将它们重混,制作电影的最终剪辑。
受到图像创作领域伟大的蜂巢思维影响,类似的变化也发生在静态摄影领域。每分钟都有数千个摄影师将他们的最新照片上传到网站和app,比如instagram,snapchat, whatsapp, flickr和脸谱网。目前至少有1.5万亿张照片被发布出来,几乎涵盖了你能想到的任何一种事物;至少我目前提出的每个找图的请求都能在这些站点里得到满意答复。比如,flickr单单金门大桥的图片就有不下50万张。金门大桥的每一种可能的拍摄角度、光线条件、拍摄视角都已经有照片拍摄并发布到网上。如果你想在你的视频或电影中使用这座大桥的一个图像,实在没有理由亲自去拍摄一张这座大桥的照片。这一步已经完成了,你只需要轻松地找到它。
同样的进步也发生在3d模型领域。在sketchup这个软件生成的3d模型数据库里,你可以找到世界上大多数重要建筑物对应的细节极其详尽的三维虚拟模型。想要纽约的一条街道吗?这里有一个可以用于拍电影的虚拟场景。需要虚拟的金门大桥吗?这里有超级详细的模型,细到可以看见每一个铆钉。借助强大的搜索工具和参数说明工具,世界上任何一座桥梁的高清影像都可以传输到这个通用视觉材料词典,便于反复使用。有了这些现成的“词组”,我们可以利用随手可得的片段或虚拟场景来组合或拼凑一部电影。媒介理论家列夫·曼诺维奇(len manovich)将这称为“数据库电影”。这些基础成分图像的数据库为动态影像的创作提供了一种全新的语法体系。
毕竟,这就是作者们的工作方式。我们沉浸在一个由已有词汇构成的有限数据库中,也就是词典里,然后将这些发掘的词汇以前所未见的方式组合成文章,小说和诗歌。创作的乐趣就是重组这些词汇。作者被人强迫发明新的词汇的确少见。即使是最伟大的作者在进行魔法般的创作时,也主要是重混先人已经用过,通常是普遍使用的词汇。我们对词汇所做的这些事情很快将会应用在图像上。
对于使用这种新电影语言的导演而言,即使是最逼真的场景也是可以逐帧地进行调整、重制和改写。电影拍摄因此得以从摄影术的束缚中解脱出来。我们摆脱了那令人苦恼的拍摄方法——用昂贵的电影胶片捕捉记录现实,然后凭借所得到的素材创造你的幻想。这样的现实,或者幻想通过一个个像素累积起来,就好比一位作家用一个个词汇写就一部小说。摄影可以很好地展现世界的原本模样,但这种新兴的屏幕显示方式,就像写作和绘画一样,旨在探索世界可能会变成什么样。
然而,仅仅能够方便地制作电影是不够的,就像古登堡发明的印刷术 [1] 让生产图书变得简单,却并没有完全释放文字的魅力。想要实现真正的文字通达还需要一系列的创新和技术,使得普通读者和作者也能以实现文字价值的方式运用文字。例如,引用符号可以简单明了地标示出一个作者的文章中哪些文字是从另一位作者那里借用的。而我们在电影领域还没有类似的标识符号。一旦得到一份有大量文字的文档,你需要一个目录帮你找到相应的内容,当然还需要页码。这些工具是人们在13世纪时发明的。那么在视频领域有对应的工具么?长篇的文字需要一个字母索引,而字母索引是由希腊人发明的,后来为了图书馆图书的管理又得到进一步发展。不久以后,借助人工智能,我们将会有办法索引关联一部电影的全部内容。大约12世纪时发明的脚注,使得我们可以将与主题不太相关的说明信息在文章主体的线性逻辑框架之外进行展示。这一工具对于视频领域也同样有效。另外,文献引用(发明于13世纪)使得学者和怀疑者可以系统化地查找那些影响或阐明文章内容的来源。设想下,如果一个视频有了引用工具会怎样。当然,现在我们有超链接功能,可以将一个文字片段与另一个连接起来,还有标签功能,可以将选定的单词或词组进行分类方便后续归类使用。
所有这些发明(以及其他更多的发明)使得任何一个识字的人都可以剪切并粘贴各种观点,用自己的想法去注释这些,将它们与相关的观点联系起来,在浩如烟海的作品中检索,快速地浏览主题,重排文本,提炼材料,重混观点,引用专家的观点和喜欢的艺术家作品的片段。所以,除了阅读以外,这些工具也是文字通达的基础。
如果读写流利意味着一个人可以理解文字并灵活运用,那么新媒介的流利就意味着一个人可以同样轻松地理解动态影像并灵活运用。但到目前为止,用于可视化“阅读”的工具还未能推广到大众层面。例如,为了直观形象地比较最近的银行破产与历史上发生的类似事件,我想引用经典电影《生活多美好》(it’s a wonderful life)中的银行挤兑现象以便向你更好的说明,但却无法简便地准确指出那个场景。(我想引用的是哪几个场景以及其中哪个部分呢?)我可以像我刚刚做的那样,提及影片的名字。我可以指出那个场景的具体时间节点(youtube提供的新功能)。但是我不能把这句话与在线电影中那个准确的“段落”建立连接。我们还不能针对电影的场景建立类似于超链接的连接方式。有了流利的影像语言,我将可以直接引用一部电影中的具体画面,或者一个画面中的具体形象。我可能会是一个对东方服饰感兴趣的历史学家,而我想引用电影《卡萨布兰卡》(casanca)中一个角色戴过的土耳其毡帽。我应该能够只引用毡帽本身(不包括它覆盖的头部),即链接到“穿插”在各个场景中的帽子图像,就像我可以很方便地在文本中添加毡帽的图片链接一样。最好,我还能用其他影片中的毡帽片段为电影中的毡帽添加脚注。
有了成熟的可视化技术,我就可以为一部电影中的任何物体、画面或场景添加脚注,而素材就是其他的物体、画面或电影片段。我就可以搜索一部电影的视觉索引,仔细查看可视化的目录,或者浏览全片的可视化摘要。但是该如何实现这些功能呢?我们如何像浏览一本书一样浏览一部电影呢?
在印刷技术发明之后,人们花了几百年的时间才总结出便于消费者使用的文本阅读工具,但是第一批可视化阅读工具现在已经出现在研究实验室中,处在数字文化的边缘。例如,我们该如何浏览一部正片长度的电影?浏览一部电影的方式之一就是极速快进,将两小时的电影在几分钟内放完。另一种方式则是仿照夸张的电影预告片制成一个简化版。这两种方法都可以将几小时的电影压缩成几分钟。但是否有一种方式,可以将电影的内容转化成能够快速掌握的图像,就像我们看一本书的目录一样?
学术研究领域已经制造出一些有趣的原型机可以实现视频的总结浏览,但还不能广泛用于所有的电影。一些有着巨量片源可供选择的流行网站(比如黄色网站)已经发明了一种方式,使得用户可以花几秒钟的时间浏览整部电影的内容。当用户点击一个电影的标题时,弹出窗口就会一个接一个地闪现影片中的关键画面,形成一个快速播放的幻灯片,就像是这部电影的手翻书。简化的幻灯片就能以可视化的形式将几小时的电影概括为几秒钟。专业的软件会用于识别一部电影中的关键画面,以便最有效地总结电影内容。
可视化的窍门在于可检索性,也就是说我们有能力像谷歌搜索网页一样检索所有的电影,并找到某个具体镜头。通过输入关键词,或者说出关键词,比如“自行车和狗”,你就能提取出所有电影中涉及一条狗和一辆自行车的场景。一眨眼工夫,你就能找到《绿野仙踪》(the wizard of oz)中高驰小姐用自行车将托托带走的画面。更进一步,你想要谷歌在其他电影中找出与这个画面类似的所有场景。这种功能很快就会实现。
谷歌的云人工智能正在快速地提升可视化智能水平。不可思议的是,它能够对普通人上传的数十亿张个人快照进行分析,识别并记住所有照片中出现的每个物体。例如,一张照片中,一个男孩在一条泥泞道路上骑摩托车,人工智能将会把照片标记为“男孩在泥泞道路上骑摩托车”。同样,人工智能将一张照片的标题定为“一个炉子上的两张披萨饼”,也准确地表达了照片的内容。而且,谷歌和脸谱网的人工智能都可以检索一张照片,并告诉你里面每个人的名字。
那么,可以对一张图像进行的处理分析也可以适应于动态的影像,是因为电影仅仅是一连串静态图像的排列。但是识别电影需要更为强大的处理能力,这在一定程度上是因为加入了时间维度(随着镜头的移动,物体是否一直留在那里?)。几年之后,我们将能随意地通过人工智能来搜索视频。彼时,我们开始在动态影像领域探索古登堡式的改革的可能性。斯坦福大学人工智能实验室的负责人李飞飞就坦言:“我认为图像和视频里的像素数据就是互联网宇宙中的暗物质。我们现在正开始让它的特性显现出来。”
当动态影像更容易创作,更容易保存,更容易标注,并更容易组合成复杂的故事情节,它们也变得更容易被观众重新操控。这就使得图像获得了与词汇类似的流动性。流动的影像会快速地传递到新的屏幕界面上,时刻准备投向新的媒介,并将影响力渗透到已有的媒介中。就像字母比特数据一样,为了匹配搜索引擎和数据库,图像可以被压缩成链接的形式或进一步扩展。灵活的图像资源鼓励人们像在文本世界中所做的那样,称心地投入影像世界中的创作和消费。
除了可检索性以外,媒介中正在发生的另一项变革可总结为“可回放性”。在口头交流时代,当有人说话时,你需要仔细地听,因为一旦说完,词句就消失了。在录制技术发明之前,没有备份,就不能通过回放来聆听漏掉的内容。
几千年前,人类历史上发生了从口头交流到书面交流的巨大转变,这才使得听众(读者)有可能倒带至一个“演讲”的开头重新阅读。
书籍的变革性特征之一就是它们能够反复地把自己呈现给读者,只要读者提出需求,想要阅读多少次都可以。事实上,能够写出一本被人反复阅读咀嚼的书可以说是一位作者最高的荣誉。而另一方面,作者们会充分利用书籍的这一特征,尽可能写出会被人们反复翻阅的书,为此他们也已经探索出一些方法。他们可能会添加一些只有再次阅读才能领会的情节点,可能会隐藏一些只有再次阅读才能觉察出来的讽刺话语,又或者塞满需要仔细研究和反复阅读才能破解的细节。佛拉基米尔·纳博科夫(dimir nabokov)曾说:“一个人不能读一本书,他只能反复读一本书。”纳博科夫的小说中经常有个难以琢磨的叙述者——比如《微暗的火》(pale fire)和《阿达》(ada),这无疑会鼓励读者在读完一遍后从更为全面的角度再次回顾故事情节。最棒的神秘故事和惊险小说通常会以最后时刻难以预料的情节翻转结尾,但如果再读一遍,就会发现结局在之前已经有了巧妙的暗示。七卷本《哈利·波特》系列就夹杂了很多隐藏线索,需要读者反复阅读以寻求最大的乐趣。
在过去的一个世纪里,我们屏幕上的媒介与书籍有着很多相同之处。电影就像书籍一样,是由故事驱动,线性发展的。但与书籍不同,电影很少有机会被人反复观看。即使是最流行的大片也只能在剧院里展映一段时间,比如在当地的剧院里播放一个月,然后就很难再次看到了,只有在10年后的深夜电视节目档才可能再见。在录像带发明之前,视听材料都没有重放功能。电视节目也是一样的情况。节目会按照排期表播放。你可以在一个固定的时间段观看某个节目,否则将永远错过。人们不太可能反复观看一部新上映的电影,而只有一部分电视剧在夏季重播时才能再看。即便如此,你还需要调整自己的关注点,在剧目预定播放那天的特定时间段守在电视机前。
因为电影和电视节目的这种“类口语化”特征,节目在创作时就蕴含了这样一种假设,即它们可能只会被观看一次。这一合乎情理的假设也变成了节目的一大特点,迫使电影故事在第一次播放时向观众传达尽可能多的信息。但这种特点也弱化了节目本身的表达能力,因为有很多内容可以被设计为在观看两三遍后才能被发觉。
先是vhs格式,后来是dvd格式,然后是tivo格式,而现在有了流媒体格式,它们使得我们可以十分方便地将屏幕内容向前滚动。如果你想再看一遍某些内容,就可以轻松实现。如果你只想看一个电影或者电视节目中的几个片段,也可以随时做到。这种回放的功能也适用于广告、新闻、纪录片、剪辑片段以及其他任何网上的内容。相比任何其他方面,正是回放功能使得广告成为了一种新的艺术形式。重复观看的功能使得广告摆脱了从前的束缚——在转瞬即逝的节目中间一晃而过。一个广告节目的资料库形成后,使得它们可以像图书一样被品读以及反复品味。而且我们还可以将广告分享给其他人,与他人一起讨论、分析、研究这些广告。
现在,我们见证视频新闻不可避免地具有了回放功能。电视新闻作为短暂视频流,人们不曾指望记录或者分析它们,仅仅是囫囵吞枣过一遍。现在它们也可以被回放了。当我们回看新闻时,就能比较它们的真实性,它们的动机以及它们的假设。我们可以分享新闻,研究新闻,并混编新闻。由于大众可以反复观看先前的新闻里说过什么,这种形势也转变了政客、专家以及任何在新闻里发表言论的人的态度。
电影的回放功能成就了那些长达120小时的电影,比如《迷失》(lost)、《火线》、《太空堡垒卡拉狄加》(battlestar gctica),并让观众看得过瘾。这些电影里充斥着太多设计精妙的情节细节,以至于在人们初次观看时不会完全凸显出来,观众不得不返回到某个情节来反复品味。
当音乐变得可以被录制、被重放,音乐领域也产生了变革。现场音乐意味着体会当下的感觉,并且每场表演都会存在差异。而将音乐倒带至开头,重新聆听一模一样的表演对音乐产生了永久的影响。歌曲的平均长度变短了,而且变得更有韵律,重复更多。
现在的游戏也有类似回滚功能的相关设定,使得玩家可以重玩一遍、撤销操作,或者拥有额外的生命。玩家可以一遍又一遍地重玩某段游戏经历,每次只做微小的改变,直到掌握这个了水平。在最新的竞速游戏中,玩家可以倒放比赛过程,倒带至先前的任何一个动作节点。所有的主流软件包都有一个“还原”按钮,让你可以还原到先前状态。最好的应用程序更是允许无限次还原,使得你可以根据自己的意愿返回到先前的状态。现存的最为复杂的消费软件(比如photoshop或者illustrator)中都具备名为“无损编辑”的功能,这意味着无论你已经执行了多少操作,都可以在任何时候返回到任何一个先前的处理节点,并从那里重新开始编辑。维基百科的伟大之处也正是在于它采用了无损编辑功能,由于一篇文章先前的所有版本都会永久保留,所以任何读者都能及时地撤销已经做出的改动。这种“重做”功能会鼓励创造力。
在未来,沉浸式环境和虚拟现实也必然会具备返回先前状态的功能。实际上,任何数字产品都将具备撤销和回放功能,就像它们都会具备重混的功能。
继续发展下去,我们很可能会对任何不具备撤销按钮的体验表现出不耐烦,比如吃一顿饭。我们确实不能重温一顿饭菜的味道,如果可以的话,这必定会改变烹饪行业。
就可复制性而言,媒介的完美重复功用已经得到充分开发。但就可回放性而言,媒介的完美重复功用还未得到充分利用。随着我们开始用生活日志记录日常活动,捕捉我们的“生活流”,生活中大部分内容将具备回滚功能。典型的事例就是,一天里我会反复查看发件箱和收件箱,以便回顾我先前生活中的一些事件。如果我们预期生活可以倒带,就将会改变我们最初做事情的方式。方便、准确、深入地回顾过往生活的功能可能会改变我们将来的生活方式。
在不久的将来,只要我们在意,就可以选择尽可能多地记录我们日常的谈话交流。而且这样的过程几乎不花费过多精力,只需我们携带(穿戴)一个设备,并且回放的操作也十分简单。有些人可能会将生活中每件事情都记录下来,以便为他们的记忆提供支撑。关于回放功能的社交规矩也将视情况而定,私人谈话很有可能被列入回放功能禁止使用的范围。但在公共领域发生的事情将越来越多地被记录下来,可以被反复浏览,借助的工具可以是手机摄像头,汽车仪表盘上的网络摄像头,或是路边电线杆上的监控摄像头。按照法律规定,警察在执勤的时候需要通过穿戴设备记录下他们的所有活动。回放警察的执勤日志将会转变公众的观念,也往往能够证明警察执法是否公正。政客名流每天的活动也会被记录下来,让人们可以从多个角度反复审视,这样将会营造出一种新的文化,其中每个人的过去都是可以可查阅的。
可回放性和可检索性仅仅是动态影像领域正在发生的两个类似古登堡式印刷术的巨大转变。它们和其他的重混要素一起适用于所有的新兴数字媒介,比如虚拟现实、音乐、广播、展示,等等。
重混——对已有事物的重新排列和再利用,对传统的财产观念和所有权概念产生了巨大的破坏。如果一段旋律是你的财产,就像你的房子一样,那么未经授权或支付相应报酬的话,我对于它的使用权就会受到极大限制。但是正如前面章节说明的,数字比特媒介最显而易见的特点就在于不可触摸以及非竞争性。比特的特点更类似于观点,而非不动产。早在1813年,托马斯·杰斐逊就认识到观点并不能被完全视作财产,或者说即使它们是财产,也与不动产有所区别。他这样写道:“一个人从我这里获得了一个观点,他在接受这个观点指导的同时并没有对我造成损失;就像是借用我的烛火点亮他的蜡烛一样,他收获光亮的同时并没有让我变得暗淡。”如果杰斐逊把他在蒙蒂塞洛的房子给了你,那么你将拥有他的房子,而他就没有了。但是如果他给了你一个想法,你将获得这个想法,而他仍将保留这个想法。这种不同寻常的特性也正是当今知识产权领域不确定性的来源。
就大部分情况而言,我们的法律系统还停留在农耕时代的准则上,即将财产视为实体。这已经落后于数字时代的发展。我们并不缺乏探索尝试,只是想要在所有权日渐不受重视的领域弄清所有权如何发挥作用,是有难度的。
一个人如何“拥有”一段旋律?当你给我一段旋律后,你仍然拥有它。还有就是以什么样的方式界定?如果一段旋律与另一段1000年前的旋律只有一个音符之差,它还是属于你的么?一个人可以拥有一个音符么?如果你将它的一个副本卖给了我,如何界定一个副本?那么备份又怎么说呢,或者在流媒体中播放呢?这些并不是什么深奥的的理论问题。音乐已经是美国对外出口的一个主要产品,是价值数万亿美元的产业。那么关于非实体的音乐中哪些部分可以被拥有这一难题,以及如何对其进行重混,已经成为我们当今文化的前沿问题以及核心问题。
关于人们以音乐片段为样本进行重混是否合法的争议始终存在,尤其是在作为样本的歌曲或者借用的歌曲盈利很多的情况下,争议更甚。对于重混或再利用一个新闻媒介的素材来为其他媒介服务是否恰当的争论,也是新型新闻媒介发展的主要限制。关于谷歌能否使用扫描书籍得到的书中片段还存在法律争议,使得谷歌不得不停止了它的“图书扫描”计划。知识产权就是这样一个变化莫测的领域。
基础技术的运行有其自身的特点,而现行知识产权法律却与这一实际特点不完全相符。例如,美国版权法赋予作品创作者对其作品具有临时的垄断权,以此鼓励他们创作更多作品,但这一垄断特权已经延伸到了创作者死后的70年之久,而在那70年里,他们逝去的身体其实已经无法被任何事情所鼓励了。有些情况下,这种没有任何产出的垄断特权可以长达100年,甚至还在增长,这哪有临时性可言。在一个以网络速度发展的世界里,长达一个世纪的法律闭锁是对创新和创造力的严重损害。这个残余的负担源于我们先前生活的基于物质原子建立的时代。
全球经济都在远离物质世界,向非实体的比特世界靠拢。同时,它也在远离所有权,向使用权靠拢;也在远离复制价值,向网络价值靠拢;同时奔向一个必定会到来的世界,那里持续不断发生着日益增多的重混。尽管步伐缓慢,相关的法律还是会逐渐跟上。
那么在一个重混的世界里,新的法律应该支持什么呢?
对已有材料的利用是一种值得尊重而且必须的实践活动。正如经济学家罗默和亚瑟提醒我们的,重组才是创新和财富的唯一动力源泉。我建议随着这一问题展开思考,“借用者是否将素材做了转化?”这种重混、混搭、取样、挪用、借用的过程,是否对原有素材做了一定的转化,还是仅仅复制了原作?安迪·沃霍尔(andy warhol)是否转变了金宝罐头汤 [2] ?如果是,这个衍生品就并不完全是一个“复制品”,它已经得到了转化、突变、提升、进化。对这一问题的回答每一次或许都不同,但是否出现了转变确实是我们应该关心的问题。
因为转化是“形成”的另一种表述。承认“转化”意味着我们如今创作的作品今后将会,也应该会生成别的事物。没有任何东西能不受影响,不发生改变。我指的是,但凡有价值的创作物,最终将不可避免地以某种形式转化成其他东西。人们当然永远可以获得1997年j·k·罗琳发表的那个版本的《哈利·波特》,但不可避免的是,在未来几十年里会出现1000本根据她的原版图书创作出来的同人小说。发明或作品本身越有魅力,也就越可能被其他人所转化,而且这一过程也越重要。
在未来的30年里,最重要的文化作品和最有影响力的媒介将是重混现象发生最频繁的地方。
[1] 古登堡生于1398年,是欧洲活字印刷术的发明者,由此引发了一次媒介革命。——译者注
[2] 金宝罐头汤(campbell soup),沃霍尔于1962年创作的艺术作品,它由32块帆布构成,每块上都画着金宝罐头汤一种口味的产品。——译者注
第9章 互动 interacting
虚拟现实(virtual reality,vr)是一个虚构的世界,而人在其中的感受是完全真实的。当你在一个巨大的imax屏幕前伴着环绕立体声观看一部3d电影时,就能对虚拟现实有些许体会。那时,你将完全沉浸在一个不同的世界中,这也正是虚拟现实想要实现的目标。但这并非完全的虚拟现实,因为当你在剧院中,想象力延伸到别的地方时,身体却在原地。你仍然感觉自己坐在一把椅子上。实际上,在剧院里,你必须待在座位上,被动地向前看,才能让沉浸其中带来的魔力发挥作用。
一个更为先进的虚拟现实体验可能更类似于尼奥在电影《黑客帝国》中的经历。虽然尼奥是在计算机世界里跑跳,并与一百多个克隆人打斗,但是他的感受是完全真实的,甚至可能达到超真实——比真实体验还真实。他的视觉、听觉和触觉完全被合成的计算机世界劫持了,以至于无法觉察出这个世界的不自然。比这个更先进的虚拟现实模型则是《星舰迷航》中的全息甲板。在那个虚构的世界里,物体和人的全息影像投影十分真实,甚至还是可以触碰的实体。按照自己的意愿进入一个模拟环境是科幻作品中经常出现的梦想,它似乎早该实现了。
当今的虚拟现实技术水平处于初级的3d模式imax电影和终极全息甲板模拟之间。到了2016年,虚拟现实技术就可以让你到马里布(malibu)市一个亿万富翁的豪宅里穿行,每个房间里都塞着满满的物品,感觉就像你真的在那里一样,而实际上你不过戴着一顶头盔,待在1000英里以外的一个房产经纪人办公室中。这也正是我最近刚体验过的。一旦戴上这种特殊的头盔眼镜,你还可能进入一个幻想的世界,那里有独角兽在奔腾,而你则会真实地感觉到自己在飞翔。又或者你坐在一个办公室隔间,里面漂浮着各种触控屏幕,还有远在别处的一名同事的化身在 [1] 一旁和你说话。在每种情境下,你都会十分强烈地感到自己确实身处在那个虚拟世界里,很大一部分是因为你可以做各种事情——环顾四周,沿着任何方向自由移动,移动物体——这会让你相信自己真的在那里。
最近,我有机会将自己沉浸在众多虚拟世界原型中。这些原型中最好的已经可以让人感受到一种难以动摇的现场感。当你讲故事时,提升故事真实感的通常目的就是让人们停止怀疑;虚拟现实的目标则不是阻止人们持有某种信念,而是要增强这种信念,比如你正处在别的地方,甚至可能是另一个人。即使聪明的大脑能够清楚地意识到你实际上正坐在一把转椅上,但是嵌入到虚拟现实中的“我”将会让你相信自己正在沼泽地里艰难跋涉。
过去十年,发明虚拟现实的研究人员为呈现无比强烈的现场感设定了一种标准的演示方式。体验人员站在一个真实的等候室中央,等候虚拟现实演示,房间里平淡无奇,只有一副大黑眼罩放在凳子上。体验人员戴上眼罩后,立即就会进入到所处房间的虚拟版场景中,里面有同样普通的嵌板和椅子。从他们的角度看,并没有发生什么改变。他们可以环顾四周,发现通过眼罩看到的场景只是稍微粗糙点。但是,房间的地板开始慢慢地下降,只留下体验人员站立的那块木板不动,最后体验人员站立的那块木板漂浮在下降的地板上空30米高的地方。体验人员被要求走下那块木板,而木板已经悬浮在一个极其真实的深坑中了。几年来,这一场景的真实感得到了增强,使得体验人员如今的反应几乎完全在预料之中。他们或者无法移动脚步,或者在微微前移时浑身发颤,手心冒汗。
当我陷入这个场景中时,脑袋也晕乎了。我的意识思维始终在悄悄提醒我,自己正在斯坦福大学研究实验室的一个昏暗的房间里,但是我的原始思维已经劫持了我的身体。它坚持认为我正待在一块十分狭窄的木板上,悬在很高的空中,必须立即返回到木板上,马上!我对高空的恐惧开始体现出来。我的膝盖开始哆嗦,恶心得快要吐了。然后我做了件愚蠢的事情。我决定跳出木板,落到虚拟世界中木板下方附近的窗台上。但很显然,根本没有什么“下方”,所以我真正的身体扑在了地面上。然而,因为我其实是站在地面上的,下落时被真实房间里的两个观察员接住了,而他们站在那里就是准备接我。我的反应是完全正常的,几乎每个人都会这样跳下来。
完全逼真可信的虚拟现实即将实现。但是以前,我对虚拟现实的认识还是有些偏差的。1989年,我一个朋友的朋友邀请我来到他在加利福尼亚州雷德伍德市的实验室,见识下他发明的一些工具。所谓的实验室其实就是一幢办公大楼里的几个房间,只是少了很多桌子。四周的墙面覆盖着一层布满电线的氯丁橡胶,挂着镶满电子元件的大手套以及成排用布基胶带捆扎的泳镜。我去见的人叫杰伦·拉尼尔(jaronnier),他有着值得夸耀的齐肩金色小辫子。我不确定会发生什么,但拉尼尔向我保证会有一种全新的体验,他称之为虚拟现实。
几分钟后,拉尼尔递给我一只黑色手套,有十几条电线从手套的指头上迂回延伸到房间另一边的一台普通个人电脑上。我戴上手套后,拉尼尔将一组由各种电线缠绕悬挂着的黑色眼罩戴在了我的头上。还有一根粗粗的黑色电缆从头上的设备里延伸出来,顺着我的后背,最终连到他的电脑上。一旦我的眼神专注到这个眼罩里,我就进入了另一个世界。我所处的地方沐浴在淡蓝色的散漫光束里。我可以看到我所戴手套的位置有一个卡通版的手套形象,而这个虚拟的手套会与我的手同步运动。它现在是“我的”手套了,而且我(亲身而不是在脑海中)强烈地感觉到自己并不是在办公室里。随后,拉尼尔也用他自己的头盔和手套,以一个女孩化身的形象进入到自己发明的世界里。凭借这个美妙的系统,你可以将你的化身形象设计成任何你想要的样子。于是,在1989年,我们俩首次进入了双方共同的梦幻空间中。
拉尼尔推广了“虚拟现实”这个词汇的使用,但在20世纪80年代末期并不是只有他一个人在进行沉浸式模拟的研究。一些大学、新兴公司以及美国军方都研制出了类似的原型机,只是在实现上述现象时的方法稍有不同。当我进入到拉尼尔的微观世界里时,我感到自己已经看到了未来的发展,我想让尽可能多的朋友、同行专家都来体验一下。借助我主编的杂志(《全球概览》),我们组织了虚拟现实设备的第一次公开演示,参展的有1990年秋天时已经开发出的各种虚拟现实设备。在星期六中午到星期天中午的24个小时里,任何一个买票的人都可以排队体验多达二十几种虚拟现实原型机。凌晨时分,我遇到了迷幻剂代言人提姆·赖瑞(tim leary),他认为虚拟现实的体验堪比lsd。这令人着迷的设备给人留下强烈的印象,让人们感到近乎完全真实。这些模拟过程是真实存在的。虽然画面粗糙了些,还会经常出现卡顿,但预期的效果是无可争辩的:你感觉自己到了另外一个地方。威廉·吉布森(william gibson)这位大有前途的科幻小说作家甚至通宵体验了这种网络空间。第二天早上,当被问到如何看待这些通往虚构世界的新入口时,他第一次给出了如今广为人知的那句评论:“未来已经到来,只是尚未流行。”
然而,虚拟现 [2] 实的发展旅程极不平坦,它衰退了。人们期待的下一步发展从未发生。包括我在内的所有人都认为虚拟现实技术将会在5年内变得无处不在,最晚也会在2000年之前。但是直到2015年,杰伦·拉尼尔的先驱工作开展了25年之后,虚拟现实技术仍没有任何实质进展。虚拟现实技术发展的主要问题在于近乎逼真,但并不足够逼真。当在虚拟现实情景里停留10分钟以上时,画面的粗糙和动作的卡顿会引发体验人员的恶心不适。想要让虚拟现实设备足够强劲、流畅地运行,并且让人感到舒适从而避免恶心感,需要投入数千万美元的费用。因此,虚拟现实技术仍然远离消费者的视野,而且即使对那些依赖开发虚拟现实内容来刺激虚拟现实设备购买的新兴公司开发人员而言,虚拟现实技术似乎也是可望不可即。
然而,25年之后一个最不可能的救世主出现了,那就是智能手机!全球市场上智能手机的巨大成功推动其高分辨率屏幕质量的提升,同时降低了成本。就尺寸大小和分辨率而言,一套虚拟现实眼罩的屏幕的要求基本上与一个智能手机屏幕相差无几,所以现在的虚拟现实头戴设备的制造技术基本出自便宜实惠的手机屏幕的制造技术。手机内置的动作传感器的表现同样不断提高,成本不断降低,直到它们可以被虚拟现实技术借用来追踪头部、手部,以及身体的极其细微的动作变化。实际上,由三星公司和谷歌公司研制的供消费者使用的第一代虚拟现实原型机就是将普通手机装入到了一个空的头戴式显示器里。当你戴上三星公司的gear [3] 虚拟现实并看着手机时,你的动作会被手机追踪,所以手机会把信息发送到虚拟世界里。
不难想象,虚拟现实技术将很快会在未来的电影领域大展拳脚,尤其是那些“激动人心”的电影体裁,比如恐怖片、色情片或者惊悚片——此类电影的故事本身就会让人全身心地投入。我们也可以很自然地预料到虚拟现实技术在电子游戏领域将会占据重要地位。毫无疑问的是,将会有亿万名干劲十足的游戏玩家急忙地穿戴好服装、手套和头盔,然后传送到一个遥远的地方,在那里他们可以隐藏、射击、杀戮,以及独自或与朋友们一起探险。当然,现今推动消费者版虚拟现实技术发展的主要投资方就是游戏产业。但虚拟现实技术的应用领域绝不仅仅是在游戏方面。
现场感和互动效果是推动当前虚拟现实技术快速发展的两大亮点。“现场感”是虚拟现实技术的主要卖点。电影拍摄技术发展史上的所有变革最终都转化为提升现实感,先是从声音效果方面,再到视觉颜色、3d模式,以及更快的帧速率。在虚拟现实技术领域,这些趋势得以进一步加速发展。每一周都会有进步,屏幕的分辨率在增加,帧速率在提升,对比度在加深,色彩的空间在拓宽,高保真的声音在变锐,所有这些提升的速度都要比大荧幕上的变化更快。也就是说,虚拟现实技术要比电影更快接近“现实”。用不了十年,当你体验尖端水平的虚拟现实显示器时,你的眼睛会被蒙蔽,以为自己正在通过一个真实的窗户观看一个真实的世界。那个场景会是明亮的,没有闪光,没有肉眼可见的像素点。你将会十分确定地感觉到那就是绝对的真实世界,只不过它并不是真的。
第二代的虚拟现实设备会依靠一种新研发的“光场”(light field)投射技术以取代屏幕呈现。(第一版商用光场设备是由微软制造的hololens和由谷歌资助研发的magic leap。)基于这种技术设计的虚拟现实设备直接将影像投射到眼睛里,所以你无需佩戴黑色的眼罩设备。这使得投射出的“现实场景”可以与你不戴眼罩时通常看到的现实场景进行叠加。你可以站在你的厨房里,看到机器人r2d2[4]以绝对清晰的形象站在旁边。你可以在它四周走动,或者走近一点,甚至可以通过移动它来仔细检查,而它会始终保持它的真实可见。这种场景的叠加被称为增强现实(augmented reality,ar)。因为人工场景是添加到你通常看到的现实世界场景中,所以相比先前将这些场景放到你眼睛旁边的屏幕上,你的眼睛会更深层地聚焦,以至于这种技术引发的错觉有很强的现场感。你几乎会发誓说那些东西真的在那里。
微软设想用光场技术增强现实设备建造未来的办公室。员工们无需坐在隔间里面对一墙的监控屏幕,他们只需戴上hololenses坐在一个开放的办公室里,就可以看到四周墙面上的各种虚拟屏幕。或者,他们轻轻一点,就会被传送到一个3d会议室,与生活在不同城市的十几名同事讨论问题。又或者,他们点击进入一个训练室,在那里有一个导师会带领他们完成急救课程,引导他们的化身学习正确的操作步骤。“看到怎么做了么?现在你来做一遍。”大多数情况下,这种增强现实课程的效果要优于现实世界中的课程。
增强电影的现实感之所以在虚拟现实领域比在电影领域发展得更快,是由于头戴式显示器的巧妙应用。想要在巨大的imax电影屏幕上填充适当的分辨率和亮度以使你觉得那是通往现实的窗口,需要非常大量的计算和很高的照明要求。在一块60英寸宽的屏幕上营造屏幕清晰可见的现实场景是相对较小的一项挑战,但仍然让人生畏。如果只是在你面前的小面罩上呈现具有同样画质的小屏幕,那么就要简单得多。头戴式显示器会追随你的目光进行调整——因为它总是在你的眼前,所以你会始终看到完整的模拟现实场景。因此,如果在这个小屏幕窗口上营造出完整、清晰的3d影像,并保证无论你看向哪里,影像都在你视野里,就可以创造出基于虚拟现实设备的虚拟imax影像。因为设备固定在你的头上,所以无论你将目光移向屏幕上的任何地方,这个模拟的现实场景都会追随你的目光而改变。事实上,整个360度的虚拟世界都以同样极端清晰的形象呈现,就如同你眼前的东西一样。另外,由于人眼前的呈现区域很小,在小范围上实现画质的提升要简单得多,成本也更为低廉。一小块屏幕就能够营造出颠覆性性的现实感。
但虚拟现实技术的亮点不仅仅是“存在感”,另一个让它经久不衰的魅力源于它的互动效果。当我们佩戴虚拟现实设备时是否舒适或是会出现不适,这一点还未明确。谷歌眼镜(我也尝试过)比墨镜大不了多少,是非常温和的增强现实设备,然而大多数人在使用首个版本时仍感到很麻烦。现场感会将用户带入虚拟世界,但是虚拟现实设备的互动效果才是维持用户体验的要素。各个层面上的互动效果将会扩散影响到这个技术构造的虚拟世界的其他方面。
大约十年前,《第二人生》(second life)是网上冲浪时一个颇为流行的去处。《第二人生》的成员会创造一个完整的化身,在这个与他们“第一人生”相对的镜像模拟世界里活动。他们花大量时间用精美的服饰把自己的化身形象打扮成时髦人士,并与其他成员令人惊艳的化身开展社交活动。成员们用其化身的一生来建造超级华美的房屋,装扮光鲜地泡酒吧,跳迪斯科。这个世界里的环境和化身都是以全3d形式创造的,但受限于当时的技术,成员们仅能通过他们台式电脑屏幕以2d形式浏览这个世界。(2016年《第二人生》将以3d形式重新开启新的篇章,项目代号为“project sansa”。)化身们在互相交流时,脑袋上方会漂浮着带有文字的气球,文字内容则由拥有者键入,就像是在一本漫画书里穿行。这种笨拙的互动界面抑制了人们对任何深层次现场感的体验。《第二人生》的主要魅力就在于它是一个完全开放的空间,可以自由构建准3d的环境。你的化身在空荡的平原上行走,就像是处于举办“火人节”的荒芜之地,你可以着手建造最酷或者最离奇的建筑、房间,或者是荒野。物理规律可以被打破,材料是免费的,任何事情都是可能的。但是想掌握这晦涩的3d工具,需要花费几个小时学习。在2009年,瑞典的一家游戏公司以准3d的形式设计了一个类似的建造世界的游戏,即《我的世界》(minecraft),但它采用了傻瓜式的建筑积木,可以像大号的乐高积木一样进行堆放。由于学习游戏的过程并非必须,大量喜爱搭建的玩家投入到《我的世界》里。
《第二人生》的成功是由于它提供了具有创造力的志趣相投者进行社交的环境。但是当这种社交魔力迁移到移动互联网世界中时,没有哪个手机有足够的计算能力来运行《第二人生》那种复杂的3d情景,所以大多数用户离开了它。有大量用户转投《我的世界》,因为它粗糙的像素式界面允许其在手机上运行。仍有数百万的用户钟情于《第二人生》,而且现在每小时都有大约5万个化身在这个由用户构造的想象世界里漫游。他们中有一半的人是为了虚拟性爱而来,而这更多的依赖于游戏的社交成分而非现实感。几年前,《第二人生》的创始人菲尔·罗斯戴尔(phil rosedale)开办了另一家有关虚拟现实的新公司,尝试利用一个开放的模拟世界中的社交机会,创建一种更为真实可信的虚拟现实。
最近,我造访了罗斯戴尔取名“高保真”(high fidelity)的创业公司。正如公司名所蕴含的意思一样,他们的项目目标就是提升虚拟世界的真实感,保证实现数千或数万个化身可以同时在线,创造出一个繁荣、逼真的虚拟城市。杰伦·拉尼尔首创的虚拟现实体验允许同时有两个体验者进入。我自己以及每个体验过的人都注意到,虚拟现实中其他人的存在要比里面的其他事物更为有趣。2015年再次体验后,我发现各种虚拟世界中最棒的那些激发出的深层次的现实感并非来源于最高的像素,而是源于大量其他人的参与。为此,“高保真”项目正在探索一种巧妙的方式,充分利用便宜实惠的传感器的追踪能力,可以在两个世界中都模仿再现你眼光的注视方向。它不仅追踪你转头的方向,还包括你眼睛转动的方向。头戴式设备中内嵌的迷你摄像机会追踪你真实的眼睛,并且将你眼光注视的准确方向转移到你的化身上。这意味着如果有人对你的化身说话,他们的眼睛就会盯着你的眼睛,你的也会盯着他们的。即使你在移动,需要对话的人转动他们的脑袋时,眼睛也会继续锁定在你的眼睛上。这种眼神交流充满巨大吸引力,它能促进亲密感的产生,并延伸为一种可感受的现实感。
尼古拉斯·尼葛洛庞帝(nichs negroponte)是mit媒体实验室的负责人。他在20世纪90年代时就曾经戏谑地说男厕所的小便池比他的电脑还聪明,因为便池知道他就在那里,并会在他离开后冲水,但即使他在电脑前面坐上一整天,电脑都不会察觉。今天,这种情况依然存在。多数时候,笔记本电脑、平板电脑和手机对于拥有者是否在使用它们是忽视的。随着虚拟现实头戴设备中便宜实惠的眼动追踪设备逐渐普及,这种情况正在开始转变。三星gxy系列中最新款的手机就具备了眼动追踪技术,使得手机可以准确地了解你在看向屏幕的哪个位置。视线追踪技术可以有多种应用途径。它可以加速屏幕导航,因为在你用手指或鼠标指向一个地方确认前,通常已经先注视到一些东西了。通过统计几千人的视线在屏幕上停留的时间,软件可以绘制出一张图,显示出人们的注意力在哪些区域停留更多,在哪些区域停留更少。一个网站拥有者可以借此了解首页中哪些部分是人们真正关注的,哪些部分人们一扫而过,并利用这些信息来改善网站设计。一个app开发人员可以利用访问者的视线停留模式来发现这个界面中哪些部分引起了过多注意,暗示出需要修复的问题。安装在汽车仪表板上时,同样的眼动追踪技术可以用来侦测驾驶人员是否打瞌睡或者走神。
现在,任何一个屏幕上看向我们的这些“小眼睛”都可以学习一些额外的功能。首先,它们学习侦测人脸的大致轮廓,这在数码相机中已经被用以辅助聚焦。然后,它们学会侦测特定的脸部——比如你的——用作身份识别的密码。你的笔记本电脑会“盯着”你的脸部,并且深入到你眼睛的虹膜层面,以便在它打开电脑主页前确定是你本人在操作。最近,mit的研究人员已经教导我们机器上的眼睛学会了侦测人类的表情。当我们看着屏幕时,屏幕也在看着我们,侦测我们在看哪里,以及如何反应。mit实验室的罗莎琳德·皮卡德(rosalind picard)和拉娜·艾尔·卡利欧比(rana el kaliouby)研发出一种软件,可以精准地洞察人类的情绪,他们声称它可以侦测出一个人是否抑郁。它可以辨别出约24种不同的情绪。我曾经有机会体验了一次这款软件的测试版,皮卡德在自己的笔记本电脑上将其命名为“情感技术”。电脑面盖上那个“小眼睛”紧盯着我,可以准确地判断出我在阅读一段难懂的文字时是否感到困惑或者是否在认真阅读。当我在看一段较长的视频时,它可以区分出我是否走神。因为感知过程是实时的,这个智能软件可以根据我浏览的内容进行自动调整。比如我在看一本书时皱眉了,代表我对于一个词汇存在困惑,这时文档就会展开一个定义解释。或者当它发现我在重新读同一个段落时,它可以为那个段落补充一些注释。同样地,如果它发现我对于一个视频中的某个场景厌倦了,它可以跳过这个场景,或者快进过去。
我们为的设备配置了各种感官功能,比如视觉、听觉和触觉,这使得我们可以与它们进行互动。它们将不仅知道有人在那里,还将知道是谁,以及那人的心情如何。当然,商人们十分想要获得我们情绪的量化数据,但这些信息也能直接服务于我们,使我们的设备可以“敏感地”对我们做出反应,就像我们期待一个好朋友会做的那样。
在20世纪90年代我曾经与摇滚作曲家布莱恩·伊诺(brian eno)有过一场关于音乐技术迅速转变的谈话,尤其是音乐技术正从模拟制式奔向向数字制式的。伊诺的成名源于他发明了我们现在所称的电子音乐,因此当我听说他放弃使用大量的数字乐器时还是很吃惊的。他主要的不满在于数字乐器上萎缩的互动界面,比如小小的把手、拨片,或者方形黑盒上安装的微小按键。他只能通过手指的移动来与这些乐器互动。相比之下,有触感的琴弦,桌子大小的琴键,或者传统模拟类乐器可供拍打的肉实表面,这些都可以为身体提供与音乐之间微妙互动的机会。伊诺告诉我,“电脑的问题在于没有足够的非洲元素。”他这样说的意思是,与电脑互动时只使用按键就像是只用你的手指尖在跳舞,而人们在非洲会用全身来舞动。
嵌入式的微型传声器、摄像机,以及加速器将一些非洲元素注入到设备里。它们提供的形象化特征,为的是让设备能够听到我们,看到我们,感受到我们。扇动你的滚动进度条,拿着一个wii挥动你的手臂,晃动或者倾斜一个平板电脑。让我们把双脚、手臂、躯干、头部像手指一样都动起来。是否有一种方式允许我们让整个身体参与进来,推翻键盘的专权呢?
一个可能的答案首先出现在2002年的电影《少数派报告》(minority report)中。导演史蒂芬·斯皮尔伯格渴望在电影中展现出2050年时一个合乎情理的情境,所以他召集了一批技术专家和未来学家进行头脑风暴,以便构想出50年后日常生活的基本特征。我是这批受邀团队中的一员,而我们的工作就是描述将来的卧室环境,未来的音乐,以及更为关键的是,到了2050年你是如何在一台电脑上工作的?有一个普遍的共识就是,我们将会用整个身体和所有的感官与我们的机器进行交流。我们在其中已经加入了非洲元素,那就是站着工作而非坐着。很快,我们就有了不同的看法。或许我们还应该加入一些意大利元素,那就是用双手与机器交流。约翰·安德考福勒(john underkoffler)也是我们团队中的一员,他来自mit媒体实验室,他关于这个场景的想法远远走在了我们前面,他构想出一种使用手部动作控制可视化的数据的工作原型机。安德考福勒的系统设想最终被电影场景采纳。例如汤姆·克鲁斯扮演的那个角色站在那里,举起他那戴着类似虚拟现实手套的双手,来回移动治安监控数据的组块,就像是在指挥音乐。在他与数据一起舞动时,还会不时发出声音指令。6年以后,电影《钢铁侠》(iron man)也采用这种展现方式。主角托尼·斯达克也会使用他的手臂来指挥电脑投射出的虚拟3d化数据影像,像抓沙滩球一样抓住它们,把一组信息当作实体一样旋转。
上面的情形是电影效果,但将来真正的交互界面也很有可能会需要我们动用手掌以外的其他身体部分。把你的手臂展开置于身前持续一分钟以上,也是种不错的有氧运动。为了扩大运用范围,交互过程将会变得很像手势语言交流。将来的办公室职员将无需在一个键盘上敲击——哪怕是一个花哨亮丽的全息影像键盘也将是多余的,人们将会用新发明的一套手势语言与设备互动,那种语言与我们现在使用的有些类似,比如我们现在会通过手指的对捏来将影像变小,而手指的张开则可将影像扩大,同样当我们手指摆出两个“l”交错的方框造型时,代表我们在像照相机一样取景并选定一些事物。现在的手机几乎可以完美地实现语音识别(包括实时翻译),所以语音将是我们与设备互动的主要方式。如果你想得到一幅2050年时人们与便携设备互动的生动画面,可以设想一下人们仅使用自己的眼睛就能从屏幕上快速闪过的一堆选项中做出明确的“选定”,慵懒地发出一个勉强听见的咕哝声就能代表确认选项,并且手掌还在膝盖或腰部附近快速地摆动。在未来,一个人在喃喃自语,同时手掌还在身前舞动,就表明他正在用电脑工作。
不仅是电脑,所有的设备都需要互动。如果什么东西不能实现互动,那么它就会被作坏掉了。在过去的几年里,我一直在收集一些趣闻轶事,围绕的主题是数字时代中长大的一代人的行为表现。举个例子,我的一个朋友有个不到五岁的小女儿。就像如今的许多家庭一样,他们家没有电视机,只有电脑屏幕。有一次朋友带着女儿到另一家人那里做客,而碰巧那家人有电视,他的女儿就被大屏幕吸引了。她走向电视,在下方四处寻找,然后看看电视后面,问道,“鼠标在哪里?”一定得有种方式与这个电视互动吧!另一位朋友的儿子在两岁时就已经开始接触电脑了。有一次她和儿子在一家杂货店里购物,她站在那里解读一件商品的标签。儿子提示说:“点击它一下就行了。”当然,这个谷物食品盒子应该是可以互动的!一位年轻的朋友在一个主题公园里工作。有一次,一个小女孩给她照了张相,照完后,她告诉公园工作人员:“但这并不是真正的相机啊,它的背面并没有显示照片。”还有一位朋友的女儿刚刚学会说话,就接管了他的ipad,还没怎么学会走路,就可以用ipad里的app画画,并用app轻易地操作一些复杂的任务。有一天,朋友将一张高分辨率的照片打印到相片纸上,并将照片放在咖啡桌上。他注意到女儿走上前去,努力拖放照片想使它变大。她尝试着拖放了几次后,都没有成功,然后困惑地看着他:“爸爸,坏了。”就是这样,如果什么东西不能互动,那么它就是“坏”的。
即使是我们能想到的最死气沉沉的设备,一旦为它们加上感官功能,使得它们变得可以互动,就会获得巨大改善。在我们家中,有个老式标准的恒温器负责监控燃气炉。经过一次改造后,我们将其升级为nest公司的智能恒温器,nest的这个产品是由苹果公司的前员工组成的一个团队设计的,而最近nest公司被谷歌收购了。这个nest恒温器可以感知我们是否在场。它能分辨出我们是不是在家,是醒着还是在睡觉,以及是否外出度假。它的芯片与我们的云端相连,可以预测我们的生活习惯。久而久之,它构建出我们的起居模式,并能在我们下班回到家之前的几分钟内加热屋子(或给房子降温),在我们外出时关闭加热或降温系统。如果到了周末,或是我们在度假,它也会自动适应我们的日程安排。如果察觉到我们突然回到家中,它会进行自我调整。所有的监测能帮我们节省大笔燃气开支。
随着我们与自己制造的设备之间的互动持续增加,我们将更加赞赏人造品的形象化特征。设备和我们的互动程度越高,口碑就越好,而我们的体验也会更棒。我们可能会在这个设备上花几个小时,因此它的制作工艺至关重要。人们偏爱交互式的产品,而苹果是第一家意识到这一点的公司。iwatch上的精致工艺设定是用来感受的。我们会不断地抚摸着一个ipad,在它充满魔力的表面上敲打,双眼紧盯屏幕几小时,几天,乃至几星期。一个设备绸缎般光泽的表面触感,画面闪烁时的流畅性,温暖或冰冷的机身,制造工艺的质量,闪烁灯光的温度,这些东西对我们来说意义重大。
有什么比穿着那些能够回应我们的设备更让人有亲密和互动感呢?电脑一直稳步地向我们靠近。起初,电脑被关在远处某个装着空调的地下室里,然后被搬到了离我们近些的小房间里。随后它们爬到了离我们更近的桌子上,再然后跳到了我们的大腿上,最近则溜进了我们的口袋里。电脑下一步的显然就是靠在我们的皮肤上。我们称之为可穿戴设备。
我们可以戴上识别增强现实效果的特殊眼镜。戴上这样一个透明的电脑(早期原型是谷歌眼镜)使得我们可以看到叠加在物理世界中的无形比特字符。我们在杂货店里检查一个谷物食品盒子时,可以按照那个小男孩的建议,在可穿戴设备里轻轻一点,就能看到商品的原始信息。苹果公司的iwatch也是一部可穿戴的电脑,它具有部分健康监测功能,但主要作用还是作为通往云端的一个方便入口。整个互联网和万维网的全部超强运算能力都能通过你手腕上的小巧方块传递。狭义上的可穿戴设备特指智能衣服。当然,小巧玲珑的芯片植入到衬衫中后,这件衬衫就可以让一台智能洗衣机了解自身最佳的洗涤周期,不过智能衣服更大程度上是服务于穿衣人的。(谷歌公司资助的)project jacquard中使用的实验性智能布料中使用了导电线和柔性传感器,织成了一件可以与之互动的衬衫。就像你在ipad上做的一样,用一只手的手指在另一只手臂的袖子上滑动,而这样做的目的也是一致的:将一些东西展示到一块屏幕上,或者你的眼镜上。智能衬衫的一个例子是美国东北大学研发的原型——squid。它可以感觉(实际上是测量)出你的姿势,并以量化的方式记录下来,然后启动衬衫中的“肌肉”模块进行准确地收缩以保证你处于正确的姿势,就像是一个教练所做的指导一样。戴维·伊格曼(david eagleman)是得克萨斯州贝勒医学院(baylor college)的一名神经学家,他发明了一款能将一种感官功能转变成另一种的超级智能背心。这个感觉替代背心(sensory substitution vest)可以记录背心中的微型麦克风发出的声音,并将声波转换成失聪人士能够感觉到的震动。数月之后,靠着穿这种背心,失聪人士的大脑会自动将这种震动转化为声音,从而重新获得“听”的能力。
你或许已经看到上述技术的到来,而比起这种穿在皮肤上的技术更进一步的唯一方法,就是延伸到皮肤表层下。我们让它们进入我们的大脑,将电脑直接与大脑连接起来。通过外科手术在大脑中植入计算机模块对于盲人、失聪者以及瘫痪者确实能起作用,让他们仅用思维就可以与这种技术互动。一次进入大脑的实验证明一个四肢瘫痪的女人可以利用自己的思维控制一条机械手臂,捡起一个咖啡瓶,拿到她的嘴边,并喝到瓶中的东西。但这种高度侵入性的操作还没有被用作增益健康人的身体。实际上,非侵入性的大脑控制器已经在日常工作和娱乐中得到广泛应用,而且运作良好。我尝试过几次轻度的人机界面技术(brain-machine interfaces,bmis),实验中我仅通过思考就可以控制一台个人电脑。这类装置通常包含一个装有传感器的帽子,类似小号的自行车头盔,还有一条长长的电缆连接到个人电脑上。将它戴到头上时,其内部大量的传感器触垫就会贴在你的头皮上。这些传感器会获得你的大脑电波,而你经过一些生物反馈训练后就可以按照自己的意愿产生信号了。这些信号被编程后可以用于执行特定的操作,比如“打开程序”、“移动鼠标”和“选定此项”。你可以学会“打字”。这种技术还很粗糙,但每年都在进步。
在未来的几十年里,我们将继续拓展更多可以与之互动的事物。拓展将遵循三个方向推进。
(1)我们会继续给自己制造的事物添加新的传感器和感官功能。当然,每样事物都将获得视力(视觉功能几乎是免费的)、听力,以及gps定位能力,但我们可以一步步地添加一些新能力,比如感温探测、分子敏感性(可称为嗅觉),以及一些超人才有的能力,比如x光透视,含氧量探测,或者癌症检测。这些功能使得我们的创造物可以对我们进行反馈,与我们互动,它们还可以自我调整以配合我们的使用。就定义而言,互动性是双向的,所以这些感官能力借助技术反过来也提升了我们与技术的互动水平。
(2)互动发生的区域将会继续向我们靠近。相比手表和手机而言,技术将会离我们更近。互动过程会变得更为亲密,一直发生着,并且无处不在。与人更亲密的相关技术是一个完全开放的前沿领域。我们认为技术在私人空间中已经饱和了,但20年后我们回顾过往时,会发现如今的技术离我们仍然还很远。
(3)最大程度的互动会要求我们跳入到技术本身。这也正是虚拟现实技术允许我们实现的。计算成分离我们是那么近,以至于我们已经身处其中。在一个技术塑造的世界中,我们和他人之间的互动是以一种新的方式开展的(虚拟现实),与物质世界的互动(增强现实)同样如此。技术成为我们的第二层皮肤。
最近,我参加了一群无人机爱好者组织的活动,他们会在周日聚集到附件的一个公园里,用他们的小型四轴飞行器进行比赛。利用旗子和泡沫拱门,他们在草地上搭建出一个路线供无人机比赛。以这种速度驾驶无人机的唯一方式就是进入其中。这些爱好者在他们无人机的前端装上了小摄像头,并且他们戴上虚拟现实眼罩以实现无人机视角的观察,这通常被称为第一视角(first person view,fpv)。现在他们和无人机融为一体了。作为观察者,我戴上了一套额外的眼罩设备,这套设备能借用他们摄像头的信号,所以我发现自己也坐在同样的飞行员位置上,看到了每个飞行员所看到的东西。这些无人机在路线上的障碍之间穿梭,互相追逐,偶尔会互相碰撞,这个场景令人回想起《星球大战》电影中的飞梭大赛。一个从小操控无线电飞机模型的年轻人说,将自己浸入到无人机里并从内部驾驶飞机是他一生最享受的体验。他认为几乎没有什么事情比这种真实的自由飞行更有趣。这里没有什么东西是虚拟的,飞行体验是真实的。
目前,自由探索类电子游戏结合了最大限度的互动和最大程度的现场感。过去几年来,我一直在观察十几岁的儿子如何玩主机上的电子游戏。我自己始终无法绷紧神经,在游戏的变种世界里活到4分钟以上,但是我发现自己可以盯着大屏幕看上一小时,目睹我儿子遭遇危险,射杀坏蛋,或者探索未知的区域和阴暗的建筑。
他与同龄的大多数孩子一样,会玩那些经典的射击游戏,比如《使命召唤》(call of duty)、《光晕》(halo),以及《神秘海域2》(uncharted 2),这些游戏通常都有关于战斗开展的故事脚本。然而作为一个旁观者,我最爱的是已经过时的一款游戏,《荒野大镖客:救赎》(red dead redemption)。这个游戏的设定是西部牛仔生活的一个广袤无垠的国度。里面的虚拟世界是那样宽广,以至于玩家可以花大量的时间骑马探索峡谷和定居点,寻找事件的线索,目标含糊地游荡在这片大陆上。儿子为了完成任务会骑马去边陲小镇,而我会十分享受与他一起骑行的过程。这就像是一部你可以漫步其中的电影。这一游戏的开放式风格设计与十分流行的游戏 《侠盗猎车手》(grand theft auto)有些相似,但少了很多暴力元素。游戏中,没有人知道将会发生什么或者事情将会怎样发展。
在这个虚拟空间里,对于你可以去哪里没有任何限制。想要骑马去河边?可以。想要沿着铁轨追逐一列火车?可以。那么与火车并行,然后跳上去在火车车厢里骑马怎么样?也没问题! 或者从遍布山艾树的荒野中穿行,从一个城镇赶到下一个?你可以从一个呼喊救命的妇女身旁骑行而过,或者选择停下来帮助她。每个行动都会带来后果。她可能真的需要帮助,也可能是强盗设下的诱饵。一位评论家曾这样说:“我真心感到意外和惊喜,居然可以在骑着我的马时朝它的后脑勺开枪,接着甚至可以把它的皮剥下来。”这样的一个虚拟世界与好莱坞大片有着同样程度的真实效果,而在其中自由地朝着任何方向行动令人沉醉。
游戏中充满互动细节的展现。《荒野大镖客:救赎》中的黎明十分壮观,太阳在地平线上慢慢开始发出光芒,气温也在逐渐升高。天气的效果会在这片大陆上鲜明地体现出来,这也是玩家可以感受到的。当瓢泼大雨落下时,原本沙黄色的土地会随着雨点的润湿而适当地加深颜色。有时薄雾会降临一座城镇,好似蒙上一层薄纱,并产生模糊不清的真实画面效果。每个山顶上的粉色调会随着夜晚降临而变得暗淡。事物的纹理会不断累积。烧焦的树木,干燥的灌木丛,表面粗糙的树皮,甚至每一块卵石或细枝,大小不一的各种事物都有着极其精致的细节描绘,简单的几笔涂抹就塑造出了完美的叠加阴影效果。这种对非关键表面的处理让人十分满意,对整体的奢侈雕琢让人赞叹不已。
这个游戏的世界范围很大。一名普通玩家可能需要花大约15小时来从头到尾体验一遍,而一个有精力的玩家为了取得所有的游戏奖励,需要花40至50小时来完成。游戏进行到每一个环节时,你都可以选择任意的方向来进行下一步,以及下一步的下一步,然而无论你怎么走,你脚下的草地形态都会很完美,每片草叶的细节都清晰可见,就好像游戏创作者预计到你会在这个世界里踩到这一细小的事物。在游戏中亿万个地点中,你都可以仔细考察细节并可能获得额外奖励,但这些美妙细节中的大多数将永远无人问津。沐浴在这个游戏自由而丰富多彩的温暖环境中会引发一种强烈的信念,即这个世界是“自然存在的”,它会始终留存,并且是很棒的。这个游戏世界有着完美的细节描绘,绝妙的互动效果可以一直延伸到地平线,人在其中的整体感受就如同沉浸于一个完整的世界里。理性告诉你这不是真的,但就像我们之前身处地面高空的木板一样,你身体的其他部分都认为这是真的。这种现实感就等待着虚拟现实互动效果的发展来实现全面的沉浸。然而目前,这些游戏世界的丰富空间环境还必须依靠2d形式浏览。
便宜实惠且多产的虚拟现实设备将构成一座体验工厂。我们可以利用它去体验一些十分危险的环境,避免亲自去尝试所带来的风险,比如交战地带,深海水域,或者火山地区。或者,我们也可以利用它来体验一些作为人类无法轻易尝试的活动,比如到胃里面看个究竟,到彗星表面考察一番。或者转换下性别,又或者变成一只龙虾。或者我们可以实惠地体验一些奢侈的活动,比如到喜马拉雅山来个低空飞行。然而这些体验通常是不可持续的。实际上人们之所以喜欢旅行,某种程度上就是因为我们只作短暂停留。起码在最初阶段,虚拟现实很有可能是一种我们需要不断沉浸并跳出的体验。它塑造的现场感是那么真实强烈,以至于我们可能只想进行少量体验。但对于我们渴望采取的互动类型,却并没有任何限制。
如此众多的电子游戏是探索新型互动方式的先驱。游戏环境中无边无际的视野带来的互动自由只是一种假象。玩家或观众会被分配一些需要完成的任务,并会受到鼓励以促使其尽可能待在游戏里直到结束。游戏中的玩家行为会受到引导,并导向整个游戏章节中下一步的关卡节点,所以游戏最终还是有一个命运归宿的,而你作为玩家的选择也不是无关紧要的,但只能决定你游戏中积累的分数。整个游戏世界会有一个明确的发展方向,所以无论你在其中做出多少探索,随着时间的过去,你都将会遭遇一个不可回避的事件。当游戏中既定情节与自由互动取得微妙平衡时,就会产生一种很棒的“游戏性”感觉——你成为了某种更大的事物的一部分,随之一同向前推进(游戏的情节设定),但同时你仍然掌控着一些东西(游戏进行的“自由度”),这是一种甜蜜的感觉。
游戏的设计者负责调整这种平衡,但真正将玩家推向某个特定方向的无形力量是一种人工智能。像《荒野大镖客:救赎》这种开放式游戏中的大多数动作,尤其是那些与游戏中配角的互动,实际上都已经由人工智能负责执行了。当你随意地驻足于一个农庄前,与牧牛工聊天时,他的反应之所以那么自然合理,是因为维持他运行的是一个人工智能内核。在虚拟现实和增强现实的其他方面,人工智能也能发挥作用。它可以“看见”并测量你在现实世界中真正站立的位置,以便据此将你传送到一个虚构的世界,还包括测量你身体的运动过程。无需特殊的追踪设备,一个人工智能系统就可以监测你在办公室内坐下、站立、走动等行为,并且将它们投射到虚拟世界中。一个人工智能系统还可以读取你在虚拟世界中的行动路线,计算出需要那种干涉来将你引导至某个特定方向,就像神在操纵一样。
在虚拟现实技术中有一个隐含的真相,那就是虚拟现实里发生的每件事情,无一例外都会被追踪记录。虚拟世界可以被界定为一个受到全面监控的世界,因为没有哪件虚拟现实中发生的事不受监控。这使得我们可以方便地实行游戏化行为——奖励分数,提升等级,或是根据贡献打分等,提供更多乐趣。然而,我们现在所处的物质世界已经装设了各种传感器和交互界面,这使得它已经变成了与虚拟世界类似的、可以追踪的世界。我们可以将这个布满传感器的现实世界设想成一个非虚拟的虚拟现实,而我们每天的大多数时光都在其中度过。当我们被周围的事物追踪时,实际上我们自己也在追踪自身以寻求自我的量化数据。我们可以使用与虚拟现实中类似的互动技术。我们将可以使用与虚拟现实中同样的手势与我们的设备、车辆进行沟通。我们可以采用相同的游戏化方式创建奖励机制,在现实生活中引导人们向预先设定的方向前进。你可以通过各种行为积累分数度过一天,比如正确地刷牙,行走了10000步,或者安全驾驶。这种愿望的实现归功于这些行为都是可以被追踪的。你在日常小测验中表现优异将不会得到a+,而是获得等级提升。你也可以通过捡垃圾或资源回收来获得分数奖励。这样,不仅仅是虚拟世界,普通的生活也可以被游戏化。
在人类短短几十年的寿命期限中就能“扰乱”社会发展的第一个技术平台是个人电脑。移动电话是第二个平台,它们都是在短短的几十年里引发了社会中一切事物的变革。下一代颠覆性的平台就是虚拟现实,而它已经到来了。下面,让我们看看不久的将来,沉浸于虚拟现实和增强现实中的一天是怎样的。
我处在虚拟现实中,但不需要头戴式显示器。回溯到2016年,当时很少有人能做出这种惊人的设想,那就是你无需佩戴眼罩,甚至一副眼镜也不用戴,就可以获得“足够好的”基本增强现实效果。房间角落中隐藏的迷你光源可以将一个3d的影像直接投射到我的眼睛里,使得我无需在脸上佩戴任何东西。对于数万个应用程序中的大多数而言,这种增强现实的质量已经足够好了。
我首先打开的应用是“身份覆盖”。它能识别人们的面孔,并显示出他们的名字和所属团体,如果他们与我存在联系,也会一并显示出来。现在我已经习惯于它的存在了,没有它我就没法出门。我的朋友说还有几款准合法的身份类应用可以提供有关陌生人的大量即时信息,但你需要佩戴上一套设备以保证你查看的信息不外泄,否则你会因为行为粗鲁被标记。
我戴上了一副增强现实眼镜出门,为的是在我的世界中获得一种类似x光下的视野。我会先用它来找到良好的网络信号,眼镜中世界的颜色越偏暖色,代表我越临近网络带宽负荷高的地方。增强现实开启后,无论我看向任何地方的任何物体,都能召唤出这个地方历史上的模样,这个精巧的小功能在我到罗马游玩时常常使用。当我在罗马斗兽场(coliseum)遗迹上攀爬穿行时,能够看到一个完全3d的、未毁坏的斗兽场影像,其大小与遗迹一样,并且会随着我的移动保持同步变化。我还能通过眼镜看到其他游客留下的一些评论钉在城市中的各个小角落里,而这些可见的评论只能通过眼镜在特定地方看到。我也在一些地方留了些小便签,让其他人去发现。眼镜中还能展现出街道下面的地下供水管道和电缆,这一点尤其令我着迷。在我用过的这些神奇app中,有一款能够让你看到的每件事物上漂浮着美元标示的价值,还是用大大的红色数字显示。几乎我关注的每样事物都被应用程序覆盖,就行像幻影一样显示在事物周围。现在,大部分公共艺术都是3d幻象。在我们城市广场有一个精制的旋转3d投射影像,就像博物馆的艺术品展览一样,一年之中更换两次。在增强现实的世界里,市中心大多数建筑的外观都有另一种装扮,并且都由建筑艺术家设计。每次我行走在城市之中,它们看起来都是不一样的。
中学期间,我一直戴着虚拟现实眼罩。相比没有玻璃镜片的增强现实眼镜,这种轻型的虚拟现实设备可以提供更为生动的画面。在课堂上,我可以看到各种模拟过程,尤其是还可以反复观看指导步骤。我喜欢“制作者”课上的“幽灵”模式,课程内容有烹饪或者电子黑客。我就是通过这种方式学会如何焊接的。在虚拟现实课堂里,为了以正确的姿势抓握住虚拟的焊接条并对接上虚拟的钢管,我将双手直接重叠放置到老师的虚拟手位置上,我会尽可能地让自己的双手进入老师影像的阴影区里以保证动作准确。就这样,我的虚拟焊接成果就像我的动作一样完美。运动时,我会戴上一个全头盔式显示器,在一个真实的运动场地上,照着一个标准的幽灵身体模仿动作。借助这种360度视角的观摩我可以更有效地反复练习动作。即使在房间里,我也会花大量的时间进入虚拟现实世界里练习动作。如舞剑这样的运动,都完全是在虚拟现实中进行。
在我的“办公室”里,我会在额头上戴上一个增强现实面罩。这个面罩就像是一个弯曲的发带,大约有手掌那么宽。它与我的眼睛之间隔开了几英寸,以便保证我全天佩戴时尽可能舒适些。这个功能强大的面罩会在我周围投放虚拟屏幕。大约有12块大小不一的虚拟屏幕,面对大量数据我也可以用双手全力应对。在我一天的工作中,会与虚拟同事进行大量的交流,这个面罩能够提供足够好的分辨率和运行速度。由于我能在一个真实的房间里看到他们,所以我在现实中也完全在场。同事的拟真3d化身能够按原比例准确地再现他们的真人样貌。我和同事通常坐在各自的真实房间的虚拟桌子前工作,虽然我们各自独立工作,但是我们可以走到对方的化身旁。我们互相交流,或者无意间听别人的讲话,就好像我们是在同一个房间里。召唤出一个化身是那么的简便,以至于即使我和同事就处在真实房间中的另一侧,我们也会在增强现实中见面,而不用走一段距离。
当我想细细品味下增强现实效果时,就会戴上一套增强现实漫游系统。我戴上特殊的隐形眼镜,它为我提供了360度的视野和无可挑剔的虚构的幻影形象。戴着这个眼镜时,我很难从外观上确定自己看到的东西是不是虚幻的,除非在有些情况下我大脑中的一部分能明确地意识到,比如一个7米高的哥斯拉怪兽矗立在街道上是绝对是幻想的产物。我的每根手指上都戴着一个指环,用于追踪我的手势。藏在我衬衫和头带里的迷你镜头则可以追踪我的身体姿势。而我身上便携装备里的gps可以追踪我的位置,定位精确到几毫米。这样一来,我在我的家乡漫步时就好像到了另外一个世界,或者一个游戏平台里。当我穿过真实的街道时,原本平常的物体和空间经过转换变得不同寻常。在真实的人行道旁边的一个真实的报刊架,变成了一个增强现实游戏中在22世纪才会出现的精致的反重力变换器。想要获得最大程度的虚拟现实体验,得有一套全身穿戴的虚拟现实装备。装备穿起来特别麻烦,所以我只是偶尔才会用上。我的家里有一套业余的虚拟现实套装,它包含一个直立盔甲,以防我摆动身体时摔倒。当我在虚拟现实里追杀龙时,就能进行全身的有氧运动了。事实上,很多人家中地下室里的健身器材都被虚拟现实盔甲取代了。但一个月中也会有一两次,我会与朋友来到当地的realie剧院,获得最先进的虚拟现实技术。考虑到卫生,我穿上了自己的丝质内衣,然后钻进一套包裹四肢的可充气外骨骼设备里。这时,产生了令人惊奇的触感反馈效果。当我用虚拟的手抓住一个虚拟的物体时,我能感觉到它的重量,也就是施加在我手掌上的压力。这是因为充气设备正在以相应的压力值挤压我的手掌。如果在虚拟世界里我的胫骨撞到了石头,我腿上的护套也会适当地“撞”击我的胫骨,制造出一种完全真实可信的感觉。一个躺倒的座位会支持我的躯干,使我可以真实地感受到跳跃、翻滚,以及撞击。另外,以超高分辨率准确显示影像的头盔,双耳道的声音,甚至还有即时的气味,这些感觉共同营造了令人信服的现场感。在进入体验的两分钟时间后,我基本已经忘记了我真正的身体在哪里,我就在那个虚拟现实世界里。一个realie剧院中最棒的就是,有250个人在以同等的真实度与我共享这个世界,而且没有任何延迟。与他们一起,我可以在一个幻想世界里做些实际的事情。
虚拟现实技术还为用户带来了另一项好处。虚拟现实技术塑造的强烈现实感将原本互相矛盾对立的两种特征放大了。它提升了现实感,使得我们可能将虚假的世界当作真实的,这也正是一些游戏和电影的目标。同时,它又支持虚构,将假象发挥到极致。例如,在虚拟现实中可以轻易地扭曲物理现象,我们可以移除重力或摩擦力,或者将虚构的世界模拟成一个外星球环境,比如一个水下的文明世界。我们也可以让化身改变性别、拥有其他肤色,或是变成另一个物种。25年来,杰伦·拉尼尔就一直幻想着利用虚拟现实技术把自己变成一个会走路的龙虾。软件会将他的手臂换成龙虾的钳子,他的耳朵换成触须,他的脚换成尾巴,这些转变不仅仅是视觉形象上的,还会包括相应的运动机能。最近,在斯坦福大学的虚拟现实实验室里,拉尼尔的梦想变成现实了。现在,虚拟现实创造软件已经变得足够灵敏和强大,足以快速模拟出这种个性化的幻想。我也可以利用斯坦福大学的虚拟现实设备i号修改我自己的化身形象。在实验中,一旦我进入虚拟现实,我的手臂会变成双脚,而双脚会变成手臂。也就是说,我想要用虚拟世界中的脚踢东西,不得不挥动真实世界中的手臂。为了测试这种倒置效果能否运行,我不得不用手脚来回拨弄飘在空中的气球。一开始,我的动作是笨拙、令人尴尬的。但惊奇的是,没过几分钟,我就可以自如地用手臂踢腿,用腿脚挥拳。斯坦福大学的教授杰瑞米·拜伦森(jeremy bailenson)将虚拟现实设备作为社会学研究实验室的终极工具,他发现人们通常只需4分钟就可以将大脑中的手脚操控的神经回路进行重新连接。我们的身体属性比我们认为的要更具流动性。
这样会引发一个问题,那就是想要确定网络上一个人的真实性变得极为困难。外部特征是易于操控改变的。有的人可能会把自己伪装成一只龙虾,但实际上他是一个留着长发的电脑工程师。以前,你还可以通过查看他的朋友状态来确认这个人的真实性。如果一个网络上的人在社交媒体上没有任何朋友,那么他很有可能就不是他所声称的那个人。但现在,黑客、罪犯、叛乱者都可以创造傀儡账户,而这种账户有着虚构的朋友以及虚构的朋友的朋友。他们还有皮包公司,并且这个皮包公司在维基百科上还有伪造的说明词条。脸谱网所拥有的最有价值的资产并不是他们的软件平台,而是他们掌控的近十亿人的“实名制”身份信息,而且这些信息是经过具有真实身份的朋友和同事认证过的。对这种持久性身份标识信息的垄断才是推动脸谱网取得卓越成就的真正动力,但这种垄断是脆弱的。在数字世界里,我们曾经用以证明我们是谁的常规方式——比如密码和验证图片,将不再能有效发挥作用。一张验证图片是一种可视化谜题拼图,对人类来说可以很简单地解决,对电脑而言则较为困难。而现在人们在解决这类问题时却遇到了困难,机器却可以轻松地解决。密码也同样易于被破解或盗取。那么还有什么比密码更好的解决方式么?答案就是你自己。
你的身体就是你的密码。你的数字身份证就是你自己。虚拟现实技术会捕捉你的动作、追踪你的眼睛、识别你的情绪,并将你的特征尽可能压缩概括以便将你传送到另一个世界,同时还让你相信自己身在那里。为了实现这些目标,虚拟现实技术开发的所有工具、采取的所有形式,以及所有这些互动过程都是针对你而设计的,因此这也就成为了你身份的证明。在生物测量学领域(追踪你身体信息的传感器背后的科学领域)有一个反复出现的令人惊奇的现象,那就是几乎我们所测量的每种生物特征信息就个体层面而言都是独一无二的。你的心跳模式是独一无二的,你的步态是独一无二的,你在键盘上敲击的节奏是与众不同的。另外,你使用最频繁的词汇,你坐下时的姿势,你眨眼的频率,以及你的声音,这些都是与他人不同的。当这些信息组合起来时,就可以形成一套几乎无法被仿造的元模式。实际上,这也就是我们在现实世界中识别他人时采取的方式。当我与你见面并被问及我们是否曾经见过这样的问题时,我的潜意识会将一系列的细微特征——声音、面孔、体形、风格、怪癖、举止——混在一起,然后综合判断出我们是否认识。在技术化的世界里,我们将采用类似的各种测量信息来考察一个人。系统会核查一个人的各种属性,包括脉搏、呼吸、心率、声音、面孔、虹膜、表情,以及数十种其他难以察觉的生物签名,并将这些信息与其声称的那个人(或事物)的特征匹配判断。这样,我们的互动方式将成为我们的密码。
互动的程度在提升,并且将继续提升。然而简单的非互动的事物仍将存在,比如木柄锤子。尽管如此,互动化的社会中越来越有价值的的将是包括智能锤子在内的那些可以互动的事物。可是,高互动性也会带来一定的成本。想要互动,就需要掌握技能、学会配合、多加体验,并加强学习。我们需要把自己嵌入到技术中,并培养自身能力。之所以如此,更因为我们才刚刚发明出互动的新方法。未来的技术发展很大程度上将取决于新型互动方式的发掘。在未来的30年里,任何无法实现密切互动的事物都将被当作“坏”掉的东西。
[1] 电影《星球大战》中的经典机器人角色。——译者注
[2] burning man festival,美国一个民间组织发起的反传统狂欢节,每年在内华达州黑石沙漠中举行。——译者注
[3] 日本任天堂公司于2006年推出的第五代家用游戏机,其第一次将体感引入游戏,具有革命性意义。——编者注
[4] 电影《星球大战》中的经典机器人角色。——译者注
第10章 追踪 tracking
我们并不了解自己。通过测量与自身相关的数据揭露我们隐秘的天性,是一项只有短暂历史的不凡工作。直到不久前,一个人得绞尽脑汁才能想到办法测量与自身相关的数据,同时不被自己误导。用科学方法实现自我追踪是昂贵、繁琐、有局限的。但在过去几年里,廉价的微型数字传感器能轻易记录各类不同的参数,以至于几乎人人都能测量上千种和自身有关的数据。这些涉及自身的实验已经开始改变我们对医疗、健康和人类行为的看法。
透过数字技术的魔力,温度计、心率监测仪、运动追踪器、脑电波探测仪以及上百种其他的复杂医疗设备都能缩小到和书上的字,甚至标点一样大。这些肉眼可见的测量设备能够嵌入手表、衣服、眼镜、电话,或者是房间、汽车、办公室以及公共空间这些操作成本不高的地方。
2007年春天,我住在加州北部。一天,我和一位医生朋友艾伦·格林(n greene)在屋后杂草丛生的小山上徒步旅行。我们一边沿着泥泞的小路向山顶缓缓行进,一边讨论当时的一项新发明——塞进鞋带中的微型计步器。它能记录下每一步,然后将数据储存到ipod中便于以后分析。我们可以利用这台微型设备计算出爬山消耗的卡路里,或是追踪我们一段时间内的锻炼模式。
一周后,我和《连线》杂志记者加里·沃尔夫(gary wolf)又在同样的地方徒步旅行。他对这些新兴自我追踪装置的社会意义感到好奇。当时此类设备总共只有十多种,但我们都预见到,当传感器不断变得更智能时,追踪技术将大行其道。这是一种怎样的文化趋势?加里指出,当我们依赖数字而不是文字时,将构建出一个“量化自我”。2007年6月,加里和我在网上宣布,将召开一次“量化自我”见面会,欢迎所有认为自己正在实践这类行为的人参加。我们没有给“量化自我”下具体定义,想看看会有哪些人出现。第一次活动中,超过20人来到了我在加州帕西菲卡市的工作室。
他们追踪的项目种类之多让我们大吃一惊。他们用可量化的单位测量自己的饮食、体质、睡眠模式、心情、血液因子、基因、地理位置,等等。有些人还自己制造设备。有人为了把力量、耐力、专注力和效率提升到极限,花了5年时间实行自我追踪。如此进行自我追踪是一般人难以想象的。今天,全世界有150个量化自我团体,超过30,000名成员。8年以来,每个月都有人在量化自我大会上展示一种之前看来几乎不可能实现的巧妙新方法,追踪生活的某个方面。即便有人因为某种极端的个人习惯显得格外突出,他的行为不久也会被看作是稀松平常的。
计算机科学家拉里·斯马尔rry smarr)追踪了大约100项健康数据,包括他的皮肤温度、皮肤电反应以及血液生化指标。每个月他都排列出自己粪便中微生物的组成,而这反映了他的肠道微生物系统组成情况。这个领域正迅速成为医学界最有前景的前沿方向之一。有了这个数据流,再加上大量的业余医学调查资料,斯马尔在没有医生提示症状的情况下,诊断出自己患有克罗恩病(crohn’s disease),或溃疡性结肠炎。外科手术证实了他的诊断。
斯蒂芬·沃尔夫勒姆是发明mathematica的天才。这是一款智能数学处理软件(相对于文字处理软件)。作为一个痴迷数字的人,沃尔夫勒姆将他的计算能力用在了1700万份与自己生活有关的文件中。他处理了自己25年来收发的所有邮件,还记录了13年来自己每一次的键盘敲击、通话电话、脚步移动、在家中和办公室里的不同房间穿梭的轨迹以及出门后的gps位置。他追踪了自己写书和写文章时修改校订的次数。借助自己发明的mathematica软件,他把自我追踪变成了一种可以展示几十年来自己日常生活模式的“个人分析”引擎。有些模式是难以察觉的,比如他在分析自身的数据之前并不知道自己在一天中什么时候效率最高。
设计师尼古拉斯·费尔顿同样在过去5年里追踪并分析自己所有的邮件、信息、脸谱网和推特上的帖子、通话以及旅行记录。每年他都生成一份年度报告,将前一年的数据结果形象化。2013年,他总结道,自己平均每天有49%的时间是高效的,但星期三效率最高,达到了57%。他的独处时间占总时间的43%,睡眠时间占总时间的三分之一(32%)。他使用这份定量综述来帮助自己更好地记忆曾经见过面的人的名字。
在量化自我会议上,我们看到有人追踪自己的习惯性拖拉行为、喝咖啡的量、警觉程度以及打喷嚏的次数。老实说,任何可以追踪的事物都有某个地方的人在进行追踪。在最近的国际量化自我大会上,我提出了这个挑战:让我们想一个最不可能测量的事物,看看有没有人在追踪测量。于是我询问500名自我追踪者:“有人追踪自己指甲的生长状况吗?”这看上去十分荒唐,但还是有一个人举起了手。
更微缩的芯片、更强劲的电池以及云端连接激励了一些自我追踪者尝试时间跨度很长的追踪,尤其在健康方面。大多数人每年去医院检查一次身体的某些健康指标就不错了。试想,如果看不见的传感器每天都测量并记录你的心率、血压、温度、血糖、血清、睡眠模式、体脂、活动水平、心情、心电图、脑功能等,你会得到关于每项指标的上万个数据点。你能掌握自己一年中各个时间段、各种状况下的身体数据,包括放松或压力大时、生病或健康时。几年后,你就能精确地了解什么是自己的常态,即指标水平在其中波动的狭小范围。在医疗中,常态是一个假想的平均状态。某人的常态并不适用于另一个人,反之亦然。平均的常态对具体某个人来说作用不大。然而,通过长期的自我追踪,你会得到个人的基准水平,也就是你的常态,当你感觉不舒服或想用自己的身体做实验时,这个常态会很有价值。
不久的将来,一个极其个人化的身体记录数据库(包括完整的基因序列)可以用来打造个人治疗方案和个性化医疗。科学能够通过你生活的日志,为你专门生成治疗方案。例如,家里的一台智能的个性化制丸机能够完全按照你当前的身体状况把药物进行混合。如果早上的治疗减缓了症状,系统还会调整晚上的剂量。
目前,标准的医学研究方法就是在尽可能多的受试者身上做实验。受试者数量(n)越多,研究效果将越好。当n等于100000的随机人群时,我们才能根据实验结论推测一个国家的状况,因为此时受试人群中的离群个体对结果的影响在经过平均后能够消除。事实上,由于经济原因,大多数医学实验的参与者都不到500人。当然,科研中的n=500时,如果操作谨慎,就能通过药物批准。
另一方面,如果一项量化自我的实验中的n只有1,受试者就是你自己。你开始可能会觉得n=1的实验在科学上是无效的,但是这对你个人来说是极其有效的。从多方面看来,这是一个理想实验,因为你所测试的变量x是特定对象,即你的身体和心智在某一时刻的即时状况。谁会关心治疗是否对他人有效呢?如果想了解治疗是否对你有效,那么一个n=1的实验提供的结果完全适用。
n=1的实验(是科学时代之前所有医疗的标准程序)真正的问题不在于它的结果没什么用处(其实是有用的),而在于它很容易误导你自己。我们对于身体、食物、世界的运作(例如蒸发理论、振动理论和细菌理论)都有直觉和期望,而这些会让我们忽视真正发生的事情。我们猜测疟疾是空气不好导致的,于是搬到更高的地方住,这确实带来了些许改善。我们猜测麸质会导致臃肿,于是倾向于找到生活中支持这项猜测的证据而忽视那些认为麸质和臃肿无关的反面证据。受到伤害或感到绝望时,人们尤其容易受偏见影响。n=1的实验要想成功,必须将测试者的期望和受试者的期望分开,但由于一个人同时具有两种身份,这是极其困难的。为了克服这种固有的偏见,人们发明了大量受试者参与的随机双盲测试 [1] 。由于受试者不知道他们的测试考察的是什么,因此不可能带有偏见。在自我追踪的新时代中,我们用自动化装置克服部分n=1的实验中自我误导的问题(在传感器长时间的多次测量中,受试者会“忘记”测试这回事)。我们还能追踪多个变量从而分散受试者的注意力,然后使用统计工具尝试发掘出模式。
从许多针对大数量总体的传统研究中我们了解到,治疗起作用常常是因为我们相信它有作用。这又被称作安慰剂效应。这些量化自我的追踪并不完全拒绝安慰剂效应,它们反而与安慰剂效应共同起作用。如果干预过程带来了可测量的改善,那么它就是有效的。我们关心的不是这种改善是否来自安慰剂效应,而是它能否对这个唯一的受试者起作用。因此,安慰剂效应可以是正面的。
在正式研究中,你需要一个对照组来抵消对于正面结果的偏见。在n=1的实验中,量化自我实验者,用自身的基准水平代替对照组。如果你追踪自己的时间足够长,指标足够多,就能在实验之外(或之前)建立你的表现模式,在对比时可以作为对照组有效地使用。
这些关于数字的讨论都掩盖了一个关于人类的事实:我们的数学直觉很差。人类的大脑不擅长统计。数学不是我们天生的语言。甚至在解读非常形象化的图表以及数值图时我们也需要高度集中注意力。从长远看,量化自我过程中的量化成分会变得不明显。自我追踪将远远超越数字化的范畴。
举个例子,2004年,德国的信息技术经理乌多·瓦赫特(udowachter)把一个小数字罗盘的内芯取出来焊接到一条皮带上。他绕皮带一圈埋入了13条压电振子,也就是让智能手机振动的零件。最后,他入侵电子罗盘的系统,让它不在圆形屏幕上显示北的方向,而是让连成一圈的皮带的不同部位产生振动。皮带上“对着”北方的部位会一直振动。当乌多系上皮带后,他就能通过腰部感受北的方位。不到一周时间,他对北的方位感觉就准确无误了。他不用思考就能指出北的方向,他是无意识的,但就是知道。几周后,他的位置感得到了增强,就好像他能感觉到一座城市的地图。数字追踪产生的量化信息被结合到了全新的身体感觉之中。长远看来,这是我们身体传感器中许多数据流的最终归宿,它们将不再是数字,而是新的身体感觉。
这些新的合成感觉不仅仅是娱乐性的。我们的自然感觉在数百万年的演化过程中确保了我们可以在一个匮乏的世界生存。没有足够的能量、盐或脂肪对我们是残酷的威胁。马尔萨斯和达尔文指出,每个生物种群都会扩张到将要发生饥荒的极限。今天,在技术带来的富足世界中,生存的威胁来自过量的菁华物质。太多的菁华打破了我们新陈代谢和心理的平衡。而我们的身体还不太能留意到新的失衡状况。演化过程中,我们不能够感觉到血压和血糖水平。但是技术能做到。比如,scanadu的scout这个新型自我追踪设备,尺寸和瓶盖一样,只要用它接触你的前额,它就会一次性测量出你的血压、变化的心率、心脏功能(心电图)、氧水平、体温和皮肤电传导。不久它也将能测量你的血糖水平。最终你会把它穿戴在身上。这些信息不以数字形式而是以我们能感觉的方式反馈给我们,比如腰部的振动、臀部的挤压。设备会让我们获得对于身体的新感觉,这是我们没有演化出来但却亟需的感觉。
自我追踪的范畴远远大于健康。它涵盖了我们的整个生活。微型可穿戴的数字“眼睛”和“耳朵”能够记录我们一天中每分每秒的所见所闻,从而帮助我们记忆。我们储存的一连串电子邮件和信息构成了记录自身想法的日志。我们还可以记录听过的音乐、读过的书和文章以及去过的地方。我们日常的走动和会面,以及非常规的事件和经验中的重要细节,也能被数据化,并汇集成基于时间顺序的流动信息。
这种流动信息被称作“生活流”(lifestream)。计算机科学家大卫·格勒恩特(david gelernter)于1999年首先描述了这个词。他构想的“生活流”不光是一个数据档案,还是一种新型的计算机界面组织方式。基于时间顺序的“流”将代替桌面,而“流浏览器”将代替网页浏览器。格勒恩特这样定义“生活流”的架构:
“生活流”是按时间顺序排列的文档“流“,相当于你的电子化生活日记。你建立和收到的所有文档都会被储存在你的“生活流”中。“流”的底端是过去的信息(从你的电子出生证明开始)。远离底端,也就是向现在的方向移动,“流”更多地包含最近的文档,比如图片、通信、账单、电影、语音信息、软件等。从现在向未来的方向移动,“流”包含着你将来需要的文档:提醒、日历项目、待办事项。想象一下,有一本日志会自动翻页,能追踪你生活中的每一个瞬间。你可以坐等新文档的到来,它们会落在“流”的前端位置。向下移动指针浏览你的“流”,或点一下屏幕上的文档,弹出的页面包含文档的内容。你可以往回查看或看一看未来一周甚至十年应该做什么。你的整个计算机网络人生会呈现你的面前。
每个人都会生成自己的“生活流”。当我遇见你时,我们的“生活流”就在某个时刻发生了交集。如果我们预备下周见面,交集将发生在未来;如果我们去年见过面或出现在一张照片里,那么交集发生在过去。丰富的交织关系让我们的“流”变得异常复杂,但是每个人的“流”都严格遵照时间顺序,因而非常容易导航。我们会自然而然沿着时间线定位一个事件。比如“这发生在圣诞旅行之后,但在我的生日之前”。
关于“生活流”作为一种结构性隐喻的好处,格勒恩特说:“‘我把这条信息放在哪儿了’这个问题,总是只有一个准确的答案——在我的‘流’中。与文档层级相比,时间线、纪年表、日记、日报、剪贴簿这些概念在人类的文化和历史中更加根深蒂固。”格勒恩特对一名sun公司的计算机代表说:“当我获得一段新的记忆——比如,某个阳光明媚的下午与梅丽莎在‘红鹦鹉’酒店外的一次交谈——我不用命名这段记忆或是把它塞在某个目录下。我可以使用记忆中的任何内容作为检索的关键词。我也不需要命名电子文档,或把它们放进目录。我只要获得他人的许可,就能把他人的‘流’混入我的‘流’中。反映我电子生活的个人‘流’可能混入包括我所属团体或组织的其他‘流’。最终,我的‘流’中还将混入诸如报纸、杂志等各种类型的‘流’。”
从1999年开始,格勒恩特多次尝试开发其软件的商业版本,但一直未能成功。一家购买了格勒恩特专利的公司曾起诉“苹果”公司,认为“苹果”盗用“生活流”的想法并用在自家的“时间机器”备份系统上(在“苹果”的时间机器上,要想恢复一份文件,你只要滚动时间线,回到需要的日期,就能得到包含当时计算机上所有内容的“快照”)。最近,格勒恩特和儿子丹尼尔再次尝试开发一款运用“生活流”的商业化产品,叫做dittach [2] 。
事实上,我们已经在使用一款(至少部分包含)“生活流”产品,那就是脸谱网。你的脸谱网“流”是包括照片、新消息、链接、提醒以及生活中其他文件在内的流动信息。新的内容被不断地添加到“流”的前端。如果愿意,你可以在脸谱网中加入能捕捉你正在听的音乐或正在播放的电影的小控件。脸谱网还提供了时间线界面,方便你回顾过去。超过十亿人的“流”能与你发生交集。朋友或陌生人在帖子上点“赞”或标记出照片中的一个人,两股“流”就有了交叉。每天,脸谱网都在把更多时事或新闻“流”以及公司快讯加入“世界流”之中。
但这些只是部分内容。“生活流”是一种主动且有意识的追踪。当人们从相机中抓取照片、标记朋友或是刻意在“四方网” [3] (foursquare)上的某个地点签到时,他们就在主动地管理自己的“流”。甚至他们的fitbit [4] 数据,包括步数计算,也都是主动的,因为这些数据存在的目的就是想获得人们的关注。如果不进行某种程度上的关注,你就不能改变自己的行为。
无意识且不主动的追踪同样重要。这种被动的追踪方式有时被称作“生活记录”(lifelogging),也就是简单、机械、不动脑筋地完整记录下一切,或者说不偏不倚地记录生活中所有可记录的事物。你将来可能会用到它时才去关注它。由于大部分内容永远都用不上,“生活记录”是一个包含巨大浪费的低效过程。今天,由于计算、存储和传感器设备十分廉价,这种浪费几乎没什么代价。但是,对于计算的创造性“浪费”是许多最成功的数码产品和公司的“秘方”。“生活记录”的优势同样在于它对计算的奢侈使用。
最早进行“生活记录”的人之一是20世纪80年代中期的泰德·尼尔森(ted nelson)(尽管他当时并没有这个概念)。发明了术语“超文本”的尼尔森把自己与任何人在各地发生的对话用录音带或录像带记录下来,这些对话的重要程度各不相同。因为和上千人见面及交谈,于是他租来一个大型集装箱,里面塞满了带子。他的后继者,90年代麻省理工学院(如今在多伦多大学)的斯蒂夫·曼(steve mann)用一个头戴式摄像机记录自己的日常生活。25年来,摄像机在他醒着的时候一直开着,记录下一年到头来每天发生的事情。他的装置在一只眼睛的上方包含一个微型屏幕,而镜头能从第一人称视角进行记录,预示着20多年后谷歌眼镜(google ss)的诞生。由于相机遮住了他的半边脸,周围人会感到不自在,但他还是无意识地随时记录自己的整个生活。
当然,微软研究院的戈登·贝尔(gordon bell)或许才是模范的“生活记录”实践者。从2000年开始的6年里,贝尔在一项被他称为mylifebits的大型实验中,记录下自己工作的方方面面。贝尔脖子上戴着一个特制的微型摄像机,它能注意到附近人的身体热量,并且每60秒拍摄他们一次。贝尔的身体相机在检测到光线发生变化时,也会拍下一张照片。贝尔记录并储存自己在电脑上的每次敲击、每封邮件、每个访问过的网站、电脑上的每个窗口以及它们打开的时间。他还记录了自己的许多对话,过去说过的话与别人产生分歧时,可以“回滚”或倒带查看。他还把收到的所有文件扫描成数字文档,并在征得当事人同意的情况下把所有电话交流记录下来。这项实验的初衷,部分在于微软想找出用来帮助员工管理生成的海量数据的某种“生活记录”工具,因为解释这些数据远比仅仅记录它们更有挑战。
创建完整的回忆是“生活记录”的重点。一份“生活记录”记载了生活中的每件事,因此它能帮你恢复那些大脑可能忘记的事情。当生活被附上索引并完全储存在“生活记录”中时,你就能像使用谷歌那样搜索你的生活。我们的生物记忆力十分不稳定,因此任何补偿都有巨大作用。贝尔的实验版完整回忆工具帮助他提高效率。它能从以前的对话中验明真相或者重获自己忘记的见解。在他的系统中,将生活转换成数字化记录不成问题,但是读取有意义的数据需要更好的工具。
受到戈登·贝尔的影响,我在衬衫上夹着一个微型相机。这款narrative相机的大小约1平方英寸。只要戴上相机,它每分钟都会拍摄一张照片。如果轻触两下机身,它就会拍摄一次。照片在云端进行处理,然后发回手机或存在网上。narrative的软件能按一天中的生活场景智能分类图片,并在一个场景中选择最具代表性的三张照片,这样大大减少了照片传输量。使用照片概览,我可以先快速浏览一天内的2000多张照片,接着展开某个具体场景找到我想要的某个瞬间。我可以在1分钟内轻松地浏览一天的“生活流”。
虽然照片的分辨率够高,效果也很自然,但是因为没有构图(镜头随衣服移动),并且是“随机”拍摄,因此不适合分享。人们可能没被拍到头部,或是在眨眼睛,又或者被一张随机的房间图挤掉,更别说拍出文艺范了。这种“生活记录”类的照片作为详尽的视觉日志,一个月中只要产生几张有价值的照片就足够了。
narrative公司发现,典型的用户在参加会议、度假或是想记录一段经历时会使用他们的产品,其中重现会议场景的效果最理想。持续拍摄的相机能够捕捉很多初次见面的人,而多年后你只要浏览一下自己的“生活流”,很容易就能想起他们以及他们说过的话,比名片更好用。“生活流”照片能有效地提示我们有关度假的回忆以及家庭生活中的大事。例如,我最近就在外甥的婚礼上使用了narrative相机。我的记录不仅包括了人人分享的标志性时刻,还有与陌生人之间的对话。这一代narrative相机不能保存声音,但是下一代产品将包含录音功能。贝尔在研究中发现,信息量最大的媒体是有照片作为提示和索引的音频信息。
使用拓展版的“生活记录”有这四条好处:
·它能365天、一周7天、每天24小时地全时段监控身体测量数据。想象一下,如果我们持续地对血糖水平进行实时监控,公共医疗会发生怎样的变化?如果你能实时监控是否有生化物质或毒素从周围环境进入血液中,你的行为将发生怎样的变化?(你或许会说:“我再也不想回到这里!”)这些数据既可以作为预警系统,也可以作为诊断疾病或用药的依据。
·它能提供包括你遇见的人、和他人的对话、去过的地方、参与过的事件在内的互动记忆。你可以搜索、获取或是分享这些记忆。
·它能提供包括所有你生产的东西、写下的文字或说过的话在内的完整存档。深层次的分析能够帮助你提升效率和创造力。
·它能提供一种组织、构造以及解读你自身生活的方式。
只要分享“生活记录”,我们就能利用信息档案协助他人工作以及扩大人脉。在生物领域,分享医疗日志能迅速加快医疗发现的进程。
许多怀疑者认为,两大挑战让“生活记录”注定只能在小范围内流行。
首先,目前的社会压力让自我追踪看上去是件十分怪异的事。拥有谷歌眼镜的人不喜欢自己戴眼镜的样子,并且和朋友在一起时用眼镜进行记录,甚至解释自己为什么不记录都让他们感到不适,于是很快把眼镜丢在一边。就像加里·沃尔夫所说:“在日记本上写日记值得钦佩,但在电子表格上写日记让人起鸡皮疙瘩。”但我相信,我们很快会发明新的社会规范和技术革新来确定“生活记录”在哪些情况下是合适的。20世纪90年代,当最早的一批人开始使用手提电话时,刺耳的电话铃声着实可怕。在火车上、浴室中或电影院里,手提电话发出高分贝的刺耳声响;通话时,人们扯着嗓子,说话声与铃声一样大。如果当时的人设想人人拥有手机的未来生活,脑中只会浮现一个永不消停的喧闹世界。如今我去看电影时,即便周围人都有手机,也不会听到铃声,甚至看不见发光的屏幕,因为这些事情被认为是不合适的。我们会发展出类似的社会习俗以及技术解决方案,让人们接受“生活记录”。
其次,当每个人每年产生的数据量达到拍字节或艾字节,而“生活记录”如何发挥作用呢?没人能遍览这海量的数据,你将毫无头绪地淹没在数据的海洋中。如今的软件大致都存在这个问题。解释数据是一项极其耗时的工作,你必须精通计算,技术熟练并且充满动力才能从数据长流中萃取有意义的信息。所以,自我追踪仍是小众的活动。然而,廉价的人工智能将能克服大部分问题。研究实验室中的人工智能已经能够筛选亿万条记录,让有意义的重要模式显现出来。举个例子,只要价格便宜,谷歌用来描述一张随机照片内容的人工智能技术可以被拿来解读我衬衫上的narrative相机里的照片。我只要用最简单的语言询问narrative相机,它就能寻找多年前我参加的聚会上某个戴着海盗帽的家伙,如果确有其人,那么我们俩的“流”也将发生联系。或者我还可以询问自己待在哪些房间时心跳会加快,影响因素是房间的颜色、室内的温度还是天花板高度?这些现在看起来有些奇特的要求在10年后,将会是很平常的机械命令,就像如今司空见惯的谷歌搜索在20年前看来很神奇。
然而,这些还不够全面。我们作为网络中的人,会进行自我追踪,并且大多数人都会追踪自己的生活。但是网络上除了人,还有更多的事物,数以亿计的事物也会追踪自己。几十年后,任何被生产出来的东西都将包含一块能联网的芯片。广泛联网带来的一个结果就是,我们可以精确地追踪一样东西是如何被使用的。例如,从2006年开始,每辆出厂轿车都在仪表盘下装有一块omb芯片,用来记录车的使用情况。它会追踪汽车的行驶里程、车速、急刹次数、过弯速度以及油耗。最初设计这些数据是用来协助车辆的维修。如果你愿意提供omb驾驶记录,一些保险商,如progressive公司会降低你的汽车保险费用。驾驶方式越安全的人支付的费用越低。汽车的gps定位也能被准确追踪,因此驾驶员在哪些道路上行驶以及行驶的频率可以成为征税的依据。我们可以把这种道路使用费看作虚拟收费站或是自动征税。
物联网的设计是用来追踪数据,这也是它所处的云端的本质属性。在未来5年中,我们预计云端中加入的340亿联网设备将会用来传输数据。云端的作用则是保存数据。任何接触云端的东西都能被追踪,也一定会被追踪。
最近,在研究员卡米尔·哈特塞尔(camille hartsell)的帮助下,我整理搜集了美国所有对我们进行常规追踪的设备和系统的清单。这里的关键词是“常规”。我排除了那些黑客、罪犯或网络部队使用的非常规的追踪手段。我还略过了美国政府部门想要追踪某些特定目标时运用的手段(政府的追踪能力和他们的预算成正比)。这张清单包含了一个普通人在平常的生活中可能遇到的追踪手段。每个例子都有官方来源,或是出现在主流出版物上。
汽车活动——从2006年开始,每辆车都包含一块芯片。当你发动汽车时,它就开始记录车速、刹车、过弯、里程、事故等状况。
高速公路交通——高速公路上的柱子和测速器上安装的摄像头通过车牌和快速追踪标志记录汽车的位置。每月有7000万个车牌被记录。
拼车软件——优步、lyft和其他零散的打车软件记录你的旅程。
长途旅行——你的航空和铁路行程被记录。
无人侦察机——“捕食者”无人侦察机监控美国边境的活动。
邮政信件——你寄出或收到的每封信的表面信息都被扫描并数字化了。
公用设施——你的用水和用电模式都被公共设备记录了(目前没有垃圾分类信息)。
手机位置和通话记录——你通话的时间、地点和对象(元数据)会被储存数月。有些手机供应商通常会把信息和电话的内容储存几天到几年不等。
民用摄像头——在大多数美国城市的中心地带,摄像头24小时不间断地记录你的活动。
商业和私人空间——如今,68%的公立机构主管、59%的私人企业主、98%的银行工作人员、64%的公立学校人员以及16%的业主在摄像头下生活或工作。
智能家居——智能恒温调节器(如nest)检测你是否在家,同时记录你的行为模式,并将这些数据传输到云端。智能插座(如belkin)监控你的用电量和用电时间并把数据分享到云端。
家居监控——视频摄像头记录你在家里或四周的活动,将数据储存在云端服务器。
互动设备——你传达给手机(siri,now,contana)、主机(kinect)或环境话筒(亚马逊echo)的语音命令和信息在云端被记录和处理。
商场会员卡——超市能追踪你购买的物品。
电子零售商——亚马逊之类的零售商不仅追踪你购买的东西,还有你浏览或想买的东西。
美国国家税务局(irs)——国税局追踪你一生的财务状况。
信用卡——显然,所有的购买行为都被追踪了。信用卡和复杂的人工智能相结合形成模式,揭示你的人格、种族、癖好、政治观点和爱好。
电子钱包和电子银行——诸如mint一类的信息采集组织追踪你的贷款、房贷以及投资等完整的财务状况。类似square和paypal这样的钱包软件追踪你的购买情况。
人脸识别——脸谱网能在他人上传的照片中辨认(标记)你的头像。照片的拍摄地点代表了你过去所处的位置。
网络活动——网页广告cookie追踪你上网时的举动。上千家顶尖网站中有80%利用网页cookies追踪你在网上的行踪。通过与广告网络(aworks)的合约,你没有访问过的网站也能得到你的浏览历史。
社交媒体——它们能辨认你的家庭成员、朋友以及朋友的朋友,还能追踪你以前的老板以及现在同事,也能了解你如何度过闲暇时间。
搜索浏览器——谷歌默认永久记录你查询过的所有问题。
流媒体服务——他们能追踪你看过哪些电影flix)、音乐(spotify)、视频(youtube)以及你的评论时间和内容。有线电视公司会记录你的观看历史。
读书——公共图书馆会保存你的借书记录一个月。亚马逊永久储存你的购买历史。kindle监控你的电子书阅读模式,包括你的阅读进度、阅读每页的耗时以及停止阅读的位置。
健康追踪——你进行身体活动的时间、地点通常会被24小时不间断记录,其中还包括每天睡觉和起床的时间。
很容易设想,能够整合所有这些“流”的机构将拥有多么巨大的权力。因为聚集这些内容在技术上十分便利,人们会害怕“老大哥”的到来。当然,目前大多数“流”都是独立的,数据并没有被整合或关联。其中,几类数据可能被捆绑在一起(比如信用卡和媒体的使用),但总体看来,不存在类似“老大哥”的大规模整合“流”。政府行动缓慢,因此其作为远远落后于技术上能达到的程度(他们自身的安全措施落后几十年)。还有隐私法案这道来之不易的“薄墙”,阻止了美国政府整合这些“流”的行动。然而,企业整合数据的行为几乎不受法律制约,因此许多公司成了政府的数据收集代理方。客户的数据是商场中的新财富,因此可以肯定:公司(和间接意义上的政府)将收集更多数据。
根据菲利普·k·迪克的短篇小说改编的电影《少数派报告》,描述了一个不太遥远的未来社会,其中监控系统能在罪犯作案前将他们抓获。迪克称这种干预为“预防犯罪”侦查。我曾经认为迪克“预防犯罪”的概念是不现实的,现在我不这么想了。
根据上面的常规追踪清单,我们不难推断未来50年的情况。所有先前无法测量的东西都被量化、数字化,并且可以被追踪。我们会持续追踪自己,我们和朋友之间也会互相追踪。企业和政府会对我们实行更多追踪。50年后,无处不在的追踪行为将成为常规。
我在先前的章节“使用”中提到,互联网是世界上最大、最快的“复印机”,任何接触到互联网的事物都会被复制。互联网想要生产更多复制品。起初,这个事实让原创个人和公司深感麻烦,因为他们的作品通常会被不加区分地免费复制,而有些东西原本是珍稀的。有人(最容易想到电影工作室和唱片品牌)反抗这种偏好,而另一些人选择顺应这种偏好。拥抱互联网对复制的偏好,并寻求难以被复制的价值(例如,通过个性化、实体化、权威性获得价值)的人会获得成功,而否认、禁止以及试图贬低复制渴望的人则落后了,将来需要试图赶上。消费者当然喜欢各种混杂的复制品,同时还通过为互联网提供内容获得好处。
对复制的偏好不仅受文化和社会影响,还是由技术决定的。这种偏好在命令经济中,在不同的社会背景下,甚至在另一个星球上也是成立的。既然我们无法停止复制,那么围绕无处不在的复制的法律和社会体制十分重要。我们如何处理创新、知识产权和责任、对复制品的拥有权和获取将会极大地影响社会的繁荣和幸福。无处不在的复制是必然的,但是我们可以对其具有的特征做出重要决定。
追踪也遵循类似的必然变化。把上文中的“复制”换成“追踪”就能把两者进行对比:
互联网是世界上最大、最快的追踪机器,任何接触到互联网的事物都可以,且都会被追踪。互联网想要追踪所有事物。我们将不断地追踪自己,追踪朋友以及被朋友、公司和政府追踪。追踪曾经是不常见的昂贵行为,因此给公民带来深深的困扰,并且一定程度上来说对公司同样如此。一些人全力对抗对于追踪的偏好,另一些人最终会顺应这种偏好。我相信试图将其规范化、民用化,以及让它更有效的人将会获得成功,而试图禁止它,利用法律排斥它的人将会落后。消费者说,自己不愿意被追踪,但他们其实不断提供数据给这台机器,因为他们想从中获得好处。
对追踪的偏好不仅受文化和社会影响,还是由技术决定的。这种偏好在命令经济中,在不同的社会背景下,甚至在另一个星球上也是成立的。既然无法停止追踪,那么围绕无处不在的追踪的法律和社会体制十分重要。无处不在的追踪是必然的,但是我们可以对其具有的特征做出重要决定。
这个星球上增长最快的就是我们生产的信息量。几十年间,信息的膨胀速度比其他任何事物都要快。信息的积累速度比混凝土用量的增长速度(7%的年增长率)更快,比智能手机或芯片出口的增长速度更快,比污染或二氧化碳这类副产品的产生速度更快。
加州大学伯克利分校的两位经济学家统计了全球信息生产量,计算出新信息正以每年66%速率增长。虽然这算不上天文数字,甚至赶不上ipods 2005年600%的增长量。但是这种激增是短暂的,不会维持数十年(ipod在2009年停产)。另一方面,信息的增长已经持续了至少一个世纪。66%的年增长速度相当于每18个月翻一番,正符合摩尔定律规定的速率。到5年前为止,人类储存了数百艾字节的信息,相当于地球上的每个人拥有80座亚历山大图书馆。而今天的信息量相当于每人拥有320座图书馆。
用信息爆炸来描述这种增长是另一种将其形象化的方式。全世界每秒钟生产6000平方米的信息存储材料,包括光盘、芯片、dvd、纸张、胶片,我们会将数据填在其中。6000平方米每秒的速率大致相当于原子弹爆炸产生的冲击波传播的速度。信息以类似核爆的方式膨胀。但与真正的原子弹爆炸不同,信息爆炸不会只持续数秒,而会一直进行下去,好比一场持续几十年的核爆。
然而,我们日常生活中产生的大部分信息都没有被捕捉或记录。尽管追踪和存储量呈爆炸性增长,日常生活的主要内容并没有被数字化。这些没有被计算在内的信息是“未开发”或是在“暗处”的信息。开发这些信息将确保我们的信息总量在未来几十年内不断翻倍。
我们会生产关于信息的信息,这导致了每年收集到的信息量不断增加。这类关于信息的信息被称为元信息(meta-information)。我们捕捉到的所有数字信息都将促进我们生产与其相关的信息。当我们手臂上的运动手环捕捉到我们行走了一步,就会立即添加一个时间标记数据,接着它会生产更多新信息把这个数据和其他步数信息联系在一起,而当这些时间标记数据被绘制成图表时,又生成了大量新数据。与此类似,当一个年轻女孩在直播视频中弹奏电吉他时,以捕捉到的音乐数据为基础,产生了关于这个视频片段的索引数据,点“赞”的数据信息以及与朋友分享后包含的复杂信息包。捕捉的数据越多,我们基于数据生产的数据就越多。这类元数据的增长速度甚至超过基础信息,并且它的规模几乎是无限的。
元数据是一种新的财富,因为比特与其他比特发生关联时,价值就会提升。比特最低效的呈现方式就是单独且直接地存在。没有被复制、分享或是与其他比特相关联的比特将是短命的。比特最糟糕的未来就是待在某个黑暗、与世隔绝的墓穴之中。它们真正想要的是与其他比特一起出去逛逛、被广泛复制、成为元比特或是一条连续代码中的行动比特。我们可以用拟人的方法这样描述:
比特想要移动。
比特想要与其他比特发生关联。
比特想要被实时测算出来。
比特想要被重复、复制和复印。
比特想要成为元比特。
当然这是纯粹的拟人手法,因为比特是没有意志的,但它们有倾向。与其他比特关联的比特将倾向于被更多地复制。就像自私的基因倾向于自我复制,比特也是如此。同理,就像基因“想要”能够帮助它们自我复制的身体编码,自私的比特也“想要”帮助他们复制和传播的系统。比特的行为方式让它们看上去想要自我复制、移动以及被分享。如果你想依靠比特完成任何事,最好明白这一点。
因为比特想要被重复、复制以及被链接,信息爆炸和科幻小说级别的追踪将不会停止。人类想要得到的很多好处来自于数据流之中。目前最主要的问题是:我们想要选择哪种全面追踪的方式?“他们”了解我们,而我们对“他们”一无所知,我们想要这种单向的环形监狱式的追踪吗?或者我们可以建立一个互动、透明的“互相监督”机制,其中包含对监督者的监督?第一个选择是地狱,第二个则容易驾驭。
从前的小镇就是标准的情形。街对面的女士会追踪你的一举一动。她透过窗户瞥一眼,就知道你什么时候去看病,什么时候买了一台新电视以及谁周末和谁待在一起。同样,你也透过窗户看她,知道她周四晚上干什么,在街角的药店把什么东西放进篮子里。互相监督对双方都有好处。如果她不认识的人趁你不在时进入你家,她就会报警。当天她不在家时,你会帮她查收邮箱中的信件。小镇上的互相监督是对称的,所以有效。你知道谁在看你,知道他们如何使用你的信息。信息是否准确,使用是否得体,你都可以向他们问责。受监督时,你也可以从中得利。最终,人们的处境是一致的。
今天我们被追踪时会感到不适,是因为我们不清楚谁在监督我们,以及他们知道多少信息。我们无法决定他们如何运用我们的信息。信息需要纠正时,我们无法向他们问责。他们记录我们时,我们无法记录他们。并且被监督能得到哪些好处并不明朗。彼此的关系是不平衡、不对称的。
无处不在的监督是必然的。因为我们无法让这个机制停止追踪,我们只能让人们之间的关系更对称。实现文明的互相监督需要技术的修补和新的社会准则。科幻小说家大卫·布林(david brin)用他的书名《透明社会》(transparent society)形容这样的世界。这种设想如何运作呢?考虑一下我在“分享”那一章中描述的去中心化的开源通货——比特币。比特币将经济体中的每一笔交易公开记录在一本公共账目上,使得所有的金融交易公开透明。交易的有效性由用户之间的相互监督而不是中央银行的监督实现。还有一个例子,一种开放式的加密软件pgp [5] 基于任何人都能查看的代码,包括一个公钥,因此人人都可以信任并验证。这些创新发明没有补救现存的信息不对称的问题,却展示了由相互警惕的机制驱动的体系如何运行。
互相监督的社会中会出现一种权利意识,即每个人都有权获取关于自己的数据,并从中受益。但是每种权利都伴随着义务,因此每个人都有义务尊重信息的完整,负责任地分享信息并接受他人监督。
用法律限制追踪的扩张或许就像用法律禁止复制一样无效。我是泄露上万份美国国家安全局机密文件的检举人爱德华·斯诺登的粉丝,因为我认为包括美国政府在内的许多政府最大的过失就是隐瞒它们实行追踪的事实。强大的政府在追踪我们,并且这种追踪完全不对称。我为斯诺登的检举叫好不是因为它会减少追踪行为,而是因为它能增加透明度。如果我们能让追踪重新变得对称,可以追踪那些追踪我们的人;如果我们能让追踪者负法律责任(应当出台相关法规),并且为信息的准确性负责;如果我们能让利益更明显且与我们更相关,那么我想追踪的扩张将是可以接受的。
我希望朋友把自己当个体看待,为了建立这样一种关系,我必须保持开放和透明,并和他们分享我的生活。我也希望公司将我当个体看待,因此我必须保持开放、透明并与它们分享信息。我还希望政府把我当个体看待,因此我必须向它们公开个人信息。个人化和透明度之间有一种对应关系,个人化程度越高所需的透明度就越高。绝对的个人化(虚荣)需要绝对的透明度(无隐私)。如果宁愿保持隐私,不对朋友和机构开放自己,那么我必须接受个性不受重视的一般化对待。我将成为一个平均数。
现在,想象一下这些选项被固定在一根滑动轨道的两端,左端是个性化和透明,右端是隐私和一般化。滑块可以向两边或中间的任何位置滑动,而这个位置代表我们重要的选择权。让人人都感到意外的是,当技术让我们进行选择(保有选择权十分重要)时,人们倾向于将滑块推向个性化和透明的那端。心理学家在20年前不可能预料到这一点。如果今天的社会媒体教会我们一些关于人类的东西,那就是人类分享的冲动胜过保持隐私的愿望。这让专家们感到惊讶。至今为止,当面临选择的时候,我们一般倾向于更多地分享、揭露以及变得更加透明。我会这样总结:虚荣战胜了隐私。
人类曾经世世代代生活在部落或宗族之中,那时我们所有的行动都是公开、可见的,没有秘密可言。我们的心智在持续的互相监督下演化。从演化角度来说,互相监督是我们的本性状态。我认为,与诸多现代怀疑态度相反,人与人之间形成循环监督的世界不会受到强烈抵制,因为我们曾经像这样生活了数百万年。如果能实现真正的平等和对称,我们会感到舒适。
这个假设并不容易达成。显然,我与谷歌或是我与政府的关系天生就是不平等的。它们能够获取每个人的“生活流”,而我只能获得自己的,这意味着它们握有质量更高的资源。但是,如果能保留一些对称性,让我成为它们更高地位的一部分,承担更多它们的责任,并能从它们提供的更好视角中获益,或许事情是可行的。可以这样说:警察当然会视频监控公民。然而只要公民也能视频监控警察,并且能够获取警察的视频,这种情况尚能接受。虽然问题并没有最终解决,但是想要透明社会就必须开始行动。
那么,该如何处理我们曾经称之为隐私的状态?在一个人们相互之间保持透明的社会,匿名有没有存在的空间?
网络让如今比过去任何时候都更有可能真正实现匿名,但它同时使得在现实生活中真正实现匿名难上加难。我们在掩盖身份的道路上每前进一步,就会在揭开身份使自己完全透明的道路上更进一步。我们既有来电显示,也有来电隐藏,后来又有了来电过滤。接下来,生物特征监测(虹膜+指纹+声音+面部+心率)让我们无处可藏。当一个人的任何信息都能被找到并存档时,世界上就没有隐私可言了。因此,不少聪明人渴望找到方便的匿名手段作为隐私的避难所。
然而,在我见过的任何系统中,当匿名变成常态时,系统必然失败。充斥匿名者的社群要么自行毁灭,要么从完全匿名变成伪匿名状态。比如,在ebay和reddit中,不断产生的昵称背后都有一个可以追踪的身份。著名的非法团体anonymous由一群完全匿名的流动临时志愿者组成。他们是一群没有固定目标的义务警察。他们会让某家信用卡公司瘫痪,或者捣毁伊斯兰国好战分子的推特账户。但是当他们不断制造麻烦时,很难说他们对于社会的贡献总体上是正面的还是负面的。
在一个文明社会中,匿名好比稀土金属。大剂量的此类重金属是已知的对生物体最致命的毒素。然而,这些元素却是维持细胞生命的必需成分。但是,保持健康所需的量少到难以测量。匿名也是一样的。难以察觉的少量匿名情况对系统来说是好的,甚至是必要的。匿名者让偶尔的告密行为成为可能,并且能保护受迫害的边缘人以及不被社会所容的人。但是当匿名大量出现时,将会危害系统。
匿名是一种逃避责任的手段。因此,推特、yikyak、redditt等网站上,大多数粗暴的骚扰都是匿名的。不用负责任的状态最大程度上释放出人类的恶。
一种流行的危险观点认为,设计系统时应当支持方便的匿名手段,用来克服对隐私的窥探。这就如同提高人体内的重金属含量,让人变得更强壮。
隐私只能通过信任获得,而信任需要稳固的身份作基础。结果是信任越多,责任越大,情况越好。就像微量元素一样,匿名者永远不应当被完全清除,但我们必须保持其数量尽可能接近于0。
数据领域的一切都趋向无限,至少是宇宙量级。在一个星球的数据量面前,一比特的数据实在微不足道。我们根本无法实际测量一个星球的数据量。事实上,已经没有合适的形容词来表示这个新领域到底有多大。你的手机的容量是吉字节级别的。太字节是我们曾经无法想象的,而如今,我的桌上就有三样容量达到太字节级别的东西。艾字节是目前地球的数量级。可能几年后我们就会达到泽字节级别。尧字节是目前有官方测量的最大数量级科学术语,更大的数量级如今还是空白。直到今天,超过尧字节的数量级还是没有被正式命名。但是,再过20年左右,我们将飞跃到尧字节级别。我提议,任何超过尧字节级别的东西都用“zillion”(无限多)来形容,这是一个涵盖所有新数量级的灵活概念。
量变将引起质变。更高的数量级带来差别。计算机科学家j.斯托斯·霍尔(j.storrs hall)写道:“如果一种东西的数量足够多,那么它很可能表现出少量单一个体所不具备的属性。根据我们的经验,万亿级别的差距不可能只是量的不同,一定还有质的区别。”一万亿倍的差距相当于一只微不足道的尘螨和一头大象之间的差异,或是50美元和整个人类的经济产出总量的差别,又或是一张名片的厚度和地球到月亮的距离之间的区别。
这种差别是“无限多级”的(zillionics)。
一万亿神经元提供的智慧是用一百万神经元无法企及的;一个zillion数据点提供的洞察力用千百万数据点是无法得到的;一个zillion芯片联网创造的一个悸动、振颤的统一体用一千万芯片是无法完成的;一个zillion超链接生成的信息和行为是用几十万链接无法想象的;社会网络在“无限多级”的领域中运行着。人工智能、机器人以及虚拟现实技术都需要对“无限多级”的掌握。但是掌握“无限多级”需要的技术令人望而生畏。
在这个领域中,用来管理大数据的一般工具不太起作用。最大似然估计(mle)的统计预测方法无法起作用,因为在“无限多级”范围内,估算最大的可能性是不太可能的。即时地操控“无限多级”量级的信息需要全新的数学领域、完全不同的软件算法以及彻底创新型的硬件。这里包含多少机会啊!
“无限多级”量级的新型数据编排方式需要一台全球规模的机器。这个机器的原子就是比特。就像原子构成分子一样,比特可以构造复杂的结构。当复杂程度变高时,比特从数据升级成信息,进而成为知识。数据最强大的地方在于它们能够以各种方式重组、重建、重用、重设、重混。比特想要互相关联,一个比特单位的数据参与的关联数越多,就越强大。
问题是,今天大部分的可用信息都是按照只有人类能理解的方式编排的。手机里的一张快照包含着一串50,000,000比特的信息,它们按照人眼能够解读的方式编排。你阅读的这本书包含的700,00比特的信息按照英语语法规则编排。但是我们到达了极限。人类不可能触碰,更别说处理“无限多级”数量的比特。为了发掘我们正在获得或创造的“无限多级”字节级别数据的全部潜能,需要把比特按照机器和人工智能能够理解的方式编排。当自我追踪得到的数据能被机器知化时,它们将为我们提供全新、新奇、先进的了解自身的方式。几年后,当人工智能可以理解电影时,我们就能用全新的方式赋予“无限多级”的视觉信息不同的目的。人工智能会像我们分析文章一样分析图像,因此,它们将像我们写作时重组文字和短语那样轻松地重组视觉元素。
基于“解绑”这个概念的新产业在过去20年里逐渐涌现。技术创业公司能将旋律从歌曲中解绑,将歌曲从专辑中解绑,从而颠覆了音乐产业。革新性的itunes售卖单曲而不是专辑。从先前的混合形式中提取或萃取出来的音乐元素能够重组成新的合成体,如可分享的播放列表。大型的综合类报纸被解绑后,分成了分类信息表(craigslist)、股市行情(yahoo)、八卦新闻(buzzfeed)、餐馆点评(yelp)以及各种自成一体并自行发展的故事。这些新元素能重新编排并重混成新的文本合成体,例如朋友用推特发布的快讯。下一步就是将分类信息、故事以及快讯再次解绑成更基本的成分,并用意想不到的方式重新编排。就如同把信息打碎成更小的粒子,让它们互相之间产生新的“化学结合”。在未来20年中,最重要的工作就是将我们追踪和创造的所有信息,包括商业、教育、娱乐、科学、体育以及社会关系,等等,放到它们最原始的级别去理解。这项任务规模极大,需要漫长的认知周期。数据科学家们将这个阶段中的信息称作“机器可读”信息,因为参与“无限多级”级别工作的不是人类而是人工智能。当你听见“大数据”这个词时,指的就是这些内容。
包含不同“化学成分”的信息能够产生数千种新的合成体以及新的信息“建筑材料”。无休止的追踪是必然的,但只是一个开始。到了2020年,我们每年能制造540亿个传感器,它们散布在全球,嵌入我们的车里,覆盖在我们身体上,监视着我们的家以及公共街道。这张传感器之网将在未来10年里产生“无限多级”字节的数据,其中每一个比特又能创造出双倍数量的元比特。经过实用人工智能的追踪、解析和知化,这片浩瀚的信息“原子海洋”会被塑造出上百种新形态、新奇产品以及创新服务。更高层次的自我追踪带来的可能性会让我们感到震惊。
[1] 双盲测试,指将提示信息,如品牌、名称等对测试者进行隐瞒,以免让其预先产生偏见的测试,现广泛应用于各种实验和市场营销中。——编者注
[2] 一个移动app,可以整合你的e-mail账户,并且将其中所有附件都整理在一起,让你能够在简单的界面上方便查找。——译者注
[3] 是一家基于用户地位置信息的手机服务网站,鼓励手机用户分享自己的所在位置。——编者注
[4] 一种智能计步器,可以记录使用者的步伐,并且能够计算出其在跑、坐、走等活动中消耗的能量。——编者注
[5] 一种电子邮件加密软件,可以用来对邮件保密,以防止非授权者阅读,并且能够通过添加数字签名等措施使收信人确认所收信件未被篡改。——编者注
第11章 提问 questioning
我对人性和知识本质的诸多认识都被维基百科颠覆了。刚开始,我和许多人一样,认为维基百科不可能成功,如今它却已经众所周知。它是一部百科全书式的在线参考资料,出人意料的是,无需许可,全世界任何人都能随时对它的内容进行补充或修改。雅加达的一个12岁孩子如果愿意,也可以编辑“乔治·华盛顿”这个词条。我过去认为年轻人和无聊的人爱捣乱,而网上这样的人不在少数,他们会让人人都能编辑的百科辞典成为泡影。我还认为那些尽责的内容提供者免不了会夸大或记错事实,让我们更难获得可靠的内容。根据自己20年的上网经验,我觉得不能信赖一个随机的陌生人提供的内容,而一群随机内容提供者聚集在一起将造成一团混乱。由专家创建的网页,如果没有编辑过也不能让我信服。一部未经编辑的百科全书,完全出自业余人士乃至不学无术者之手,似乎注定没有价值。
基于对信息结构的了解,我深信,没有刻意的大量精力和智力活动投入带来的转变,知识不会自发地从数据中产生。我曾经参与过盲目的集体写作,结果都只会产生平庸、劣质的内容。这种形式发生在网络上又有什么区别呢?
因此,当第一部标准的在线百科辞典(当时叫做nupedia)在2000年推出时没有大获成功,我并不觉得意外。尽管人人都能编辑辞典,但是nupedia要求新内容必须由一批其他内容提供者花费漫长的时间进行重写,这让新手感到气馁。然而,nupedia的创始人另外建立了一个易用的维基网站,方便人们编辑内容。令人倍感意外的是,由于任何人无需等待他人审核就能自行编辑或发布内容,人们主要的活动反而都在维基网站上。我当时对这个网站的期望值并不高,如今它已经换了一个名字——维基百科。
我当时的想法大错特错。维基百科的成功不断超越我的期许。根据2015年的最新统计,它拥有3500万篇文章,涵盖了288种语言。这项成就值得炫耀。美国最高法院引用它,全世界的中小学生依靠它,所有的记者和终身学习者借助它迅速了解新知识。人性的种种缺陷没有阻止它的持续进步。因为最少的规则限制,人们的弱点和美德都转化成了公共财富。维基百科的成功说明,借助恰当的工具,重新找回被破坏的内容(维基百科上的恢复功能)比创建一篇破坏性的文章(蓄意捣乱)更容易,因而好的文章会更普及并且质量逐步提高。人数相同时,借助恰当的工具,合作团体的成就能超越一群有野心的竞争个体。
集体向来能够放大某种力量,就像城市和市民之间的关系一样。但让我惊讶的是,我们对于工具和监管的需求如此之少。虽然在最初10年有所增加,维基百科的行政系统规模相对来说依然很小,人们几乎看不见。然而,最让人惊喜的是,我们并不知道维基百科这股力量能走多远,不知道“维基化”智力活动的极限在哪里。它能编写教科书,制作音乐或电影吗?它能制定法律或实施行政管理吗?
别急着说“不可能!”,让我们等着瞧。我有充足的理由相信,业余人士不可能制定法律,但是维基百科已经让我的想法改变了一次,我不会再轻易下结论。我们认为维基百科不可能成功,但它却成了现实。它属于理论上“不可能”做到而实践中却能完成的事情之一。一旦经历过这种事情,你不得不改变想法,期待其他类似的事情发生。说实话,其他的出版领域也尝试过维基模式,但并未获得广泛成功。方法和程序的错误导致维基百科最早版本(nupedia)失败,有鉴于此,合作的教科书、法律以及电影或许需要更先进的工具和方法。
我并不是唯一一个改变想法的人。一旦你在成长过程中已然了解维基模式的可行性,一旦你认为开源软件显然比精打细磨的专门产品更好,一旦你确信分享自己的照片和其他数据比保管它们更有意义,那么,这些想法将使我们更激进地倾向于秉持公共财富的观念。曾经被认为不可能的事情如今已变得理所当然。
维基百科还改变了我的其他看法。过去,我是一个坚定的个人主义者,一个倾向于自由论的美国人,而维基百科的成功让我对社会力量产生了新的认同。如今,我更关注集体的力量以及个人在面对集体时产生的新义务。除了拓展公民的权利,我还想拓展公民的义务。我深信维基百科的影响力还没有被完全发掘,它改变人们想法的力量正在潜意识中影响着全世界的千禧年一代,为他们提供了一个有益的蜂巢型心智的实例,并且使人们相信,“不可能的事”也能够做到。
更重要的是,维基百科让我更愿意相信“不可能”发生的事能够实现。在过去几十年中,我不得不接受那些曾经被认为不可能实现结果却能够实施的好点子。比如,1997年,我第一次遇到在线跳蚤市场ebay的时候就曾疑惑:为买一辆从未亲眼见过的二手车,我难道要把几千美元转账给一个远方的陌生人?以我对人性的了解,我觉得这件事情行不通。可如今,陌生人之间的汽车交易已经成了颇为成功的ebay公司的主要利润中心。
20年前,我或许会相信,2016年时我们的手持设备上会有全世界的地图。但是,我不太可能相信设备上有许多城市建筑的街景图,有显示公共厕所位置的“应用”,还有关于步行和公共交通的语音提示,并且地图及这些功能竟然都是免费的。这在当时看来似乎完全不可能做到。如今,丰富的免费内容已经出现在亿万台手机上。这听上去似乎还是难以置信。
那些被认为不可能的事情如今发生的频率越来越高。过去,大家都曾经认为,人们不会分文不取地工作。即便真的不要报酬,没有老板,也制造不了有用的产品。然而今天,一些在软件工具上实现的经济成果完全是由志愿者不计报酬或是在没有老板的情况下创造的。过去,大家都曾经认为,人们天生希望保护隐私,但现在,从早到晚完全公开分享这种“不可能”的事情还是出现了。过去,大家都曾经认为,人们大多数时候总是懒惰的,他们宁愿观看而不愿意去创作,永远不会离开沙发创作自己的视频,数百万业余爱好者制作的几十亿小时的视频应当不可能出现——和维基百科一样,youtube在理论上是不可能成功的。但是,“不可能”的事又一次在实践中成为现实。
每天都有过去不可能的事变得可能,并且这种情况会持续下去。但,为什么是现在?是什么打破了“可能”和“不可能”之间古老的界限?
在我看来,如今发生的那些“不可能”的事都体现了一种更高级的新型结构。它们是大规模分享带来的,更准确地说,是大规模合作和大量实时社会互动的结果。相对于一堆细胞,组织是一种更高级的新型结构;相对于人类个体,新的社会结构好比组织。在两种情形中,新的层级结构都会酝酿出新的事物。新的层级中发生了低层级中不可能出现的行为,就好像组织能够做到细胞完成不了的事。维基百科、linux、脸谱网、优步、互联网,甚至人工智能这类群体结构能够完成工业时代人类无法完成的事。
长期以来,人类都在发明新的社会组织形式——从法律、法庭、灌溉系统、学校、政府、图书馆直到文明本身这个规模最大的组织。这些社会工具让我们成为人类,使我们的行为从动物的视角看来是“不可能”的。比如,人类发明了书写记录和法律后,一种在我们的灵长类近亲中不可能实现的公正变得可能,这种公正在口头文化中同样不会出现。灌溉和农业系统中的合作与协调产生了原本更加“不可能”的诸如预测、事先准备这类行为,以及人类对未来的敏感。人类社会向生物圈展示了各种先前不可能实现的行为。
在现代的文化与技术体系中,技术元素正通过不断发明新的社会结构加速创造新的“不可能”事物。ebay的高明之处在于发明了廉价、易用、快捷的信用评价体系。人们有了这种技术手段,能够快速给予交际圈之外的人永久的信用评价,从而放心地与远方的陌生人进行交易。这项微不足道的创新开启了一种更高级的、新型的协作方式,实现了一种以前不可能做到的新交换模式(陌生人之间的远程买卖)。与此类似,技术保障下的信用加上实时的协调功能成就了打车服务软件优步。维基百科上的“恢复日志”按键使得修复一篇被蓄意破坏的段落比故意破坏内容更加容易,由此释放出一种信用的新的更高级组织形式,凸显出一种过去从未大规模实现的人类行为。
人们改变社会交往方式的步伐才刚刚启动。超链接、无线局域网以及全球卫星定位服务事实上都是通过技术形成的连接关系,而这类创新刚刚开始,大多数有可能实现的最令人赞叹的交流方式还没有被发明。人类还处于发明真正的全球组织的初期阶段。一旦我们把自己置身于全球实时同步的社会,之前不可能的事将真正开始以爆发的方式变成现实。我们没有必要刻意创造某种全球意识,只需要让每个人都能随时与他人以及其他事物相联通,并能共同创造新事物。有了人类共享的互联互通,现在看来不可能发生的奇迹将变得可能。
我期盼未来几年中自己的想法出现大的改变。我们会惊奇地发现,很多对人类来说“自然而然”的事情其实并非真的如此,而许多“不可能”的事情是可以做到的。更直白地说,如果把联系松散的人类部落中的那些司空见惯的事情放在紧密相连的世界之中,它们或许就会显得不那么自然。大家都以为人类是好战的,但是,随着解决社会冲突的新途径在全球范围内逐渐出现,我预测,有组织的战争对人们的吸引力以及它们的作用都会越来越弱。当然,也有很多难以想象的糟糕的事情我们原本认为不可能发生,但结果却并非如此,因为新技术释放了说谎、欺骗、偷窃、监视和恐吓的新方法。人们在有关网络冲突的国际规定上没有达成共识,这意味着未来几十年内或许会发生意想不到的“不可能”的恶劣事件。由于全球性的互联互通,一次相对简单的黑客攻击将造成级联式破坏的不断涌现,并且迅速达到难以置信的规模。事实上,全世界的社会结构将在所难免地遭受破坏。在未来的30年里,如果网络和电话系统全部瘫痪一天,那么,这一天带给人们的震惊记忆将在此后的几年里难以消除。
在本书中,我有理由不去关注这些负面内容。任何一项发明都可能被人们用某种方式蓄意利用,从而带来危害。天使般的技术也能被用来研制武器,并且一定有人会这么做。罪犯往往是一些世界上最富创造力的发明家。任何事物中80%的部分都是价值低劣的。然而重要的是,这些负面内容与正面内容一样符合我所描述的普遍趋势。负面事物同样会逐渐经历知化、重混以及筛选。罪行、骗局、战争、欺诈、折磨、腐败、垃圾信息、污染、贪婪以及其他不良欲望都会变得越来越去中心化,并以数据为中心。不管是美德还是邪恶都受同样的生成力量的支配。创业公司和大企业需要一直适应无处不在的分享以及持续不断的屏读,这对犯罪集团和黑客团体来说同样如此。
虽然不符合直觉,任何有害的发明都能给人们提供一个契机,去创造前所未见的有益事物。当然,有益的事物也能(或许一定会)被相应的邪恶想法所利用。善与恶相互激发的循环的加速,让我们看上去像是在原地踏步。每一轮循环以后,我们都能获得前所未有的额外机遇和选择。这一点十分关键。选择的拓展(包括选择去破坏)增加了自由程度,而更多的自由、选择和机遇是我们进步的基础,也是人性和个人幸福的基础。
技术的运作把我们抛向新的层级,开启了一个由未知机遇和令人恐惧的选择所构成的“新大陆”。全球规模的互动带来的后果超出了人类可控的范围。拍级、艾级、泽级以及“无限巨级”的庞大领域让人类难以理解,它们属于巨型机器以及星球级别,对数据量和能量的需求也是非人类的。我们在集体中的行为当然和作为个体时有所不同,但是我们还不知道会有怎样的区别。更为重要的是,集体中个体的表现也各不相同。
当人类搬进城市并开始建立文明时就在经历类似的变化。不同的是,我们向更高级以及更大规模的全球联通迈进的速率是前所未见的。社会组织形式正朝着极端巨大(比以往任何时候都大)以及极端快速(光速)的方向发生结构性转变,卷入其中的人类将以新的方式互相联通。多数“大家都知道”的关于人类的事情都是基于人类个体的,可10亿人互相联通的方式或许有100万种,其中每种都能透露出有关我们的全新事实,或者创造出我们的新特性。无论哪种情况,人性都在发生变化。
经我们许可,实时、多样以及逐渐具有全球规模的联通方式将出现在大大小小的事物中,而我们会在一个新的层级上运作,由此得到的“不可能”的成就会不断让自己感到惊讶。维基百科包含的“不可能”成分将悄悄退而成为显然的事情。
各种难以置信的现象不断涌现,此外,我们还在迈向一个以不太可能发生的事情为新常态的世界。警察、急诊室医生以及保险代理人已经见到了一些端倪。他们意识到不太可能发生的疯狂事件其实时刻都在发生。例如,一个小偷卡在了烟囱里;一名卡车司机驾车与别的车正面相撞,从挡风玻璃飞出去竟然双脚落地,安然无恙地走开;一头野生羚羊在跳过自行车道时撞倒了一位骑车的人;婚礼上的蜡烛点着了新娘的头发;一个在后院码头钓鱼的女孩儿钓到了一头和人一般大的鲨鱼。从前,这些事情是属于私人的,只会被当作谣言或朋友之间的传闻,很容易让人怀疑。人们不愿意真去相信这些事情。
但如今,它们出现在youtube上,充斥着我们的视觉空间。你能够亲眼看见这些事情发生。我提到的每一件奇闻异事都有数百万人观看过。
不太可能的事情不光指这些意外。网络上充斥着令人不可思议的表演,有人可以沿着大楼边缘向上飞奔,踩着滑雪板沿郊区屋顶朝下滑,或者眨眼间就能完成“垒杯子”。不只是人类,动物也会开门、骑车和画画。这类事情还包括非凡的“超人”成就——惊人的记忆任务或是对世界各地口音的模仿。在这些极致的技艺中我们看到了人类的超凡之处。
每分钟都有一件不太可能发生的事被上传到网上,而它只是我们一天内看见或听说的数百个非凡事情之一。网络如同镜头,能聚焦非凡的事件并把它们折射成一道能够照亮人们生活的光,把各种稀有事件浓缩在一小段可供观看的日常视频之中。如今,我们几乎整天都在网上,而只要在线,非凡的浓缩片段就能让我们大开眼界。这就是新的常态。
这些“超人”的成就正在改变我们。我们不再只想展示自身,还想要成为最好、最伟大、最非凡的展示者,就像ted视频中的演讲者一样。我们不想观看整场球赛,只想看集锦中的集锦,或者说那些最精彩的移动、接球、跑位、射门以及踢球,越是难以置信,越是“不可能”做到,我们越想看。
我们还想获得关于人类最极致的体验,包括体重最重的人,身高最矮的侏儒,胡须最长的人等等所有这些最牛的事例。这些事例数量一定是稀少的,然而,由于我们每天观看大量最牛事例的集锦视频,它们似乎成了常态。人们向来重视那些关于极端怪异者的照片或绘画(例如早期的《国家地理》或是雷普利的“信不信由你博物馆” [1] ),但是当我们在牙医诊所排队,拿着手机观看这类视频时,会产生一种亲切感。这些视频十分生动,占据着我们的思绪。我认为已经有证据表明,海量的非凡事例正激励着普通人,让他们敢于做出非凡的尝试。
与此同时,最衰的失败集锦则是另一种极致的呈现。我们每天看着世界上最笨的人做着人们能够想到的最蠢的事情,仿佛置身于一个由最微不足道、最琐碎不堪以及最鲜为人知的吉尼斯世界纪录保持者组成的世界中。每个人的一生中至少有那么一两个奇异的瞬间,因此人人都能保持一项短暂的世界纪录。好消息是,这些事情能让我们了解人类和人生更多的可能性,也就是说,极端主义拓宽了我们的极限;坏消息是,贪得无厌地追求极端状态导致我们对平凡的事物总是感到不满。
这种趋势不会停止。摄像头无所不在,因此当人们在被追踪之下的集体生活不断扩张时,我们会收集到上千个人被闪电击中的视频,因为低概率事件发生的次数比我们料想的更多。当我们穿戴着微型摄像头时,最难实现的事、最极致的成就、最极端的行动将会被记录下来并实时分享到全世界。60亿人各自最非凡的时刻将会充斥网络视频流。从此,我们不是被平凡包围在原地,而是漂浮在超凡之中,超凡随时会变为平凡。因为难以实现的事不断占据我们的视野,直到有一天我们会发现,世界上只剩“不可能”的事情,会觉得这些事情并不是那么难以实现,进而认为“不可能”的事必然会发生。
这种难以实现的状态如同梦境一般。确定性自身已经不像从前那样确定了。就好像当我连接到了一个包含全部知识的屏幕以及由数十亿人交织而成的蜂房后,这一切同时倒映在几十亿玻璃碎片上,此时的真相更难寻觅了。对于任意一条知识,你很容易就能得到一个反对观点。任何一个事实都有它的反事实。互联网的极端超链接属性将让这些反事实凸显出来。有些反事实是荒唐的,有些勉强站得住脚,而有些是有理有据的。这就是知识之屏的诅咒:你不能依赖专家解决问题,因为每个专家都有一个与其相对的反专家。因此,我所学到的任何东西都会遭到无处不在的反事实的侵蚀。
讽刺的是,在全球即时联通的时代,我对任何事情的把握反而变弱了。相比于从专家那里得到事实,我更愿意从网络上流动的事实中拼凑出自己认为确定的事。权威的、唯一的事实变成了一串事实。我不光要知道自己关心的领域中的事实,还要了解任何我接触到的事物,包括我不具备直接相关知识的领域。这意味着必须不停地质疑自以为已经了解的事情。这或许是促进科学发展的完美状态,但它同样说明,我更容易因为某些错误的理由改变自己的想法。
与各种各样的网络挂钩时,我觉得自己就像网络,试图从各种不可靠的内容中获得可靠性。我试着从半事实、非事实或其他散落的事实中拼凑出真相,却发现自己的想法被流动的思考方式(设想、临时想法、主观直觉)吸引,并且倾向于流动的媒体,如mashups、推特ese以及搜索网站。但是当我浏览网上这些流动的想法时,常常感觉像在做一场清醒的梦。
我们不知道人们为什么要做梦,只知道梦满足了意识的一些基本需求。如果有人看着我上网,就能发现我从一个推荐链接跳到另一个时会开始做白日梦。最近,我在上网时梦见自己和许多人一起观看一个光脚男子吃泥土,接着看见一个唱着歌的男孩脸部开始融化,接下来圣诞老人烧掉了一棵圣诞树,后来我漂浮在世界上最高的泥房中,再后来一个凯尔特结自行解开,然后有人告诉我制作透明玻璃的配方,最终我看见自己回到中学时期,骑着一辆自行车。而这些只是某个早晨我浏览网页的头几分钟内发生的事情。漫无目的地跟随着一个个链接,我们会落入一种出神状态,这或许是对时间的可怕浪费,或许和梦一样,是创造性地浪费时间。在网上闲逛时,我们可能陷入一种集体无意识之中。我们点击网页时做的梦可能是让我们能够做同样的梦的一种方法,而梦的内容与我们点击了什么无关。
这场名为“互联网”的清醒的梦同样模糊了严肃的想法和娱乐的想法之间的界限,说得更直白些,上网时我们已经分不清自己是在工作还是在娱乐。许多人觉得,消除工作和娱乐生活的界限是互联网最让人诟病的一点。上网是代价高昂的时间浪费。网络把琐碎和浅薄带入各个行业。前脸谱网工程师杰夫·哈默巴赫(jeff hammerbacher)曾经发出著名的抱怨:“我们这一代中最聪明的人竟然都在思考如何吸引人们点击广告。”有人认为这场清醒的梦带来了令人上瘾的对时间的浪费。恰恰相反,我珍视对时间的“有益浪费”,它是创造力不可或缺的来源。更重要的是,我相信工作和娱乐的合并、严肃地思考和娱乐地思考的结合,是互联网带来的最伟大的创新之一。高度演化的先进社会的理念不就是使人们不再需要工作吗?
我注意到蜂巢式心智已经将我的思考方式充分地推广并散布开来。我的思考方式更偏向行动而不是沉思。当出现一个疑惑或一种直觉,我不会在内心漫无目的地反复咀嚼,让自己的无知不断滋养它。我会开始做事,会迅速行动。我开始寻找、搜索、提问、质疑、突然行动、记笔记、做标记,尝试把一切变为自己的东西。我不会等待,也无需等待。有了一个想法后我会先行动而不是先思考。不少人觉得这恰恰是网络最糟的地方——让我们失去沉思的能力。另一些人觉得这些浅薄的行动只是愚蠢的瞎忙,随大流,或者是行动的错觉。但是我们拿这些与什么相比呢?是与不动脑筋地看电视、在酒吧中懒洋洋地聊天、在图书馆里拖着慢悠悠的步子却找不到心中几百个疑问的答案相比吗?想象一下这一刻正在上网的亿万人。在我眼中,他们并不是把时间浪费在愚蠢的链接上,而是进行着富有成效的思考,包括快速地得到答案、搜索、反馈、做白日梦、浏览、接触不同事物、写下自己的想法、发表哪怕是微不足道的意见。可以把他们和50年前相近数量的看电视或是在躺椅上看报纸的人做比较。
我们在网上肆意“冲浪”,“上蹿下跳”,在各种信息之间切换,刷微博或发送状态,不断熟练地浏览新内容,做白日梦,质疑一切事实。这种新的生活模式并没有错,它体现了一种特征,同时也是对淹没我们的数据、新闻和事实的海洋做出的合理回应。我们必须保持流动和机敏,流转在各种观点之间,因为这种流动性反映了我们周围动荡的信息环境。这种模式既不是懒惰的失败,也不是放纵的奢侈,而是繁荣发展的必由之路。想在湍急的河流中划独木舟,你的动作必须快如流水;同理,要对付迎面而来的艾字节级的信息量以及各种改变和颠覆的力量,你必须紧跟各个领域前沿的流转速度。
但是不要把这种流动和浅薄相混淆。流动性和互动性同样能让我们迅速把目光转移到比以前更复杂、更庞大、更深奥的工作上。技术给了受众与故事和新闻互动的能力,比如录制节目供以后观看、倒带、搜索、链接、保存、片段剪辑、剪切和粘贴,让人既能得到完整版也能得到简化版。导演们开始拍摄情景剧,而且是许多年才能讲完的大型连续故事。其中的经典大作如《迷失》《太空堡垒卡拉狄加》《黑道家族》《火线》,都包含多条交织的剧情线、多位主人公以及难以置信的角色深度。这些错综复杂的作品对持续注意力的要求不仅超越从前的电视剧和电影,甚至能让狄更斯以及其他昔日的小说家感到吃惊。狄更斯或许会惊叹地问道:“你是说观众不仅跟得上剧情,还想看更多集?能坚持很多年?”以前,我绝不相信自己会享受如此复杂的故事,或者花时间关注它们。如今,我的注意力水平已经增强了。与此类似,电子游戏的深度、复杂性以及对投入程度的需求与冗长的电影或名著不相上下,仅仅熟练掌握一些游戏就需要花费50小时以上。
然而,各种新技术其实都成了一种东西,它给我们的思考方式带来了最重要影响。看上去,你先是没完没了地看微博,网上“冲浪”或是逛youtube频道,接着仅仅用几分钟时间浏览书籍的片段,之后终于回到你的工作报表或是翻看手机频幕。事实上,你在一天中花费的这十几个小时都在关注同一种无形的东西。这个机器(或是庞大的平台,又或是巨大的杰作),伪装成了亿万个联系松散的碎片。我们不容易看到这个整体。尽管是事实,但是高薪的网站主管、成群的网络评论人以及不太情愿自己的影片在网上播放的电影大亨不相信他们只是一场全球表演中的一些数据点。只要身处40亿面屏幕的任意一面中,我们就是在参与并试图回答一个开放的问题——这个无形的东西是什么?
计算机制造商思科(cisco)估计,到2020年,互联网上除了几百亿面屏幕还会有500亿的各类设备。电子产业领域预计将有10亿可穿戴的设备,用来追踪我们的活动,并将数据加入“流”中。我们还能预计将有130亿让智能居家生活更有生气的家用装置,如nest恒温器。30亿设备将被置入在线汽车。1000亿的rfid(无线射频识别)技术将内置在诸如沃尔玛超市货架上的产品中。这就是物联网,是我们制造的所有东西的梦想之地,也是实现不太可能的事情的新平台。它是用数据建成的。
与信息关联但不等价的知识,正在以类似信息膨胀的速度爆炸式增长,每两年翻一番。而几十年来,每年发表的科学论文数量增长的速度甚至更快。纵观上世纪,全世界每年的专利申请数量呈指数增长。
我们对宇宙的了解大大超出一个世纪之前的人类。关于宇宙物理法则的新知识被我们运用到诸如gps和ipods这样的消费品上,以及用来延长自身的寿命。望远镜、显微镜、荧光镜、示波器让我们得以用不同的方法观察世界,而一旦我们开始使用新工具,就能迅速瞥见新的答案。
然而科学包含一个悖论。每个答案都会孕育至少两个新问题,因此,使用的工具越多,答案就越多,相应的问题也会更多。望远镜、放射镜、回旋加速器、粒子加速器不仅拓展了我们的知识,还拓展了我们不知道的东西。最近,受到过去发现的帮助,我们发现宇宙中96%的物质和能量是看不见的。宇宙不是由我们上世纪发现的原子和热量构成,而是由被我们称为“暗物质”和“暗能量”的未知存在构成。“暗”是无知的一种委婉说法,因为我们确实不知道宇宙中大部分物质由什么组成。更深入地研究细胞或者大脑,我们将发现自己对此同样无知。我们甚至说不出自己不知道什么。上述的这些发明能帮助我们窥探自己的无知。在科学工具的帮助下,如果知识真呈指数增长,我们应该很快就能消除困惑。然而实际情况是,我们不断发现更大的未知领域。
因此,虽然我们的知识量呈指数增长,但是问题的数量同样会以指数级的更快速率增长。数学家会告诉你,两条指数曲线之间逐渐拉开的差距本身就是指数级的。这个差距就是我们的无知,它正在呈指数增长。换句话说,科学作为一种手段,主要增长了我们的无知而不是我们的知识。
没有理由认为这一点在未来会发生改变。一项技术或工具的颠覆性越强,它生成的问题越具有颠覆性。我们可以预计,人工智能、基因操控、量子计算这些近在咫尺的未来技术将接二连三地释放新的重要问题,即我们从没想过要问的问题。事实上,保险地说,我们还没有问出最重要的一些问题。
每年,人们在网上的提问多达2万亿个,而搜索引擎给出了相应数量的答案。其中大部分答案质量很高,不少答案令人拍案叫绝,而他们都是免费的!互联网即时搜索出现之前,没有一定的花费不可能得到这2万亿个问题的答案。当然,答案只是对用户免费,而谷歌、雅虎、bing以及百度这类搜索公司创建这些答案却是需要一定费用的。2007年,我计算出谷歌回答每个提问需要的成本大约是0.3美分,并且这个数额可能逐年下降。根据我的计算,谷歌从放置在每条搜索或答案周围的广告中得到的收益为27美分,这让他们能轻松地提供免费答案。
我们永远都有问题。30年前,最大的答问业务是电话查询台。在谷歌之前我们有“411热线”。每年人们拨打通用“信息”号码“411”约60亿次。过去,另一个搜索工具是黄页。根据黄页协会的统计,20世纪90年代,50%的美国成年人每周至少使用一次黄页,查询两条内容。当时的美国成年人口数约两亿,黄页的使用数量也就是每周两亿次左右,一年则有104亿次查询。这个数量不可小觑。另一个寻找答案的经典场所是图书馆。20世纪90年代,美国的图书馆年访问人次约10亿,其中3亿左右是“查询业务”,也就是提问。
虽然在30年前,仅美国一年就有一百多亿人次查询答案,但是当时没人会相信免费或以低价格提供答案竟然可以是一桩820亿美元的生意。没有多少读过mba的人梦想着填补这方面的需求。人们对提问和答案的需求是潜藏的。在搜索功能没有实现之前,人们并不知道迅速得到答案如此有价值。2000年进行的一项研究表明,每个美国成年人平均一天在线就4个问题寻找答案。以我自己的生活为例,我问的问题更多。谷歌告诉我,2007年的某个月我问了349个问题,平均每天10个,而问题数量的峰值出现在每周三上午11点。我问谷歌一年中有多少秒?它迅速告诉我答案——3150万秒。我问谷歌所有的搜索引擎每秒的搜索总次数是多少?它告诉我60万次,或者说600千赫的频率。互联网回答问题的频率和电波一样快。
尽管答案是免费的,它们的价值却是巨大的。密歇根大学的三位研究员在2010年进行了一项小实验,试图了解普通人可能为搜索付出多少代价。他们的方法是,让一座藏书丰富的大学图书馆里的学生回答一些谷歌上的提问,但是只允许使用图书馆里的资料。他们测量学生回答一个问题的平均用时,结果发现是22分钟。谷歌回答同一个问题的平均用时为7分钟,整整少用15分钟。以美国人22美元一小时的平均时薪来算,谷歌搜索一次节省1.37美元。
2011年,谷歌的首席经济学家哈儿·范里安(hal varian)用另一种方法计算出回答一个问题的平均价值。他揭示了一个惊人的事实:根据返回的cookies等判断,谷歌的用户平均每天只搜索一次。这指的当然不是我这样的用户。我的高频率搜索行为与诸如我母亲这样几周搜索一次的人相抵消。由于问题变得廉价,我们问的问题更多了,而范里安使用一些数学方法补偿了这个因素,并计算出搜索为每个人每天节省3.75分钟。使用之前的薪资标准,人们每天节省0.6美分。如果你觉得时间很宝贵的话,我们不妨把这个值估算为1美元。人们愿意为了搜索每天支付1美元,即每年350美元吗?或许吧。当然,我自己绝对愿意。用另一种方法描述,他们可能愿意为每一次搜索支付1美元。经济学家迈克尔·考克斯(michael cox)问他的学生是否愿意完全放弃互联网,得到的答案是哪怕给100万美元他们也不愿意放弃。这件事发生在智能手机流行之前。
我们提供高质量答案的能力越来越强。只需用自然的英语提问,iphone的语音电话助手“siri”就能作答。我本人经常求助“siri”。想了解天气情况时,只要问:“‘siri’,明天天气怎么样?”安卓用户可以询问“谷歌即时资讯”来了解和他们的日历相关的信息。ibm的“沃森”证明,大多数与事实相关的问题,人工智能都能迅速准确地找到答案,部分原因是:对于先前问题的正确回答会增加人们问下一个问题的可能性,同时,过去的正确答案使得创建下一个答案更加容易,并增加了答案语料库的整体价值。我们向搜索引擎提的每个问题以及任何被我们视作正确的答案,都能改善这个过程的智能水平,提高引擎将来回答问题的价值。当我们知化更多书籍、电影以及物联网时,答案将无处不在。我们正迈向每天询问几百个问题的未来生活。大多数问题和自己以及朋友相关:“珍妮在哪儿?下一班巴士是几点?这种零食好不好?”每个答案的“制作成本”将微不足道。寻求答案的这种搜索将不再是发达国家的奢侈品,而是全世界的必需品。
我们很快就能用交谈的口吻询问“云端”任何问题。如果问题已经有了确定的答案,答题机器会向我们说明。比如,谁赢得了1974年年度最佳新秀奖?天空为什么是蓝色的?宇宙会一直膨胀下去吗?久而久之,它会学着清楚地说明什么是已知的,什么是未知的。就像人们在回答问题时一样,它可能需要先和我们对话以消除歧义。如果可能,答题机器会毫不犹豫地提供关于任何主题的深刻、模糊以及复杂的事实性知识,这一点与人类不同。
即时可靠的答案带来的最主要的结果并不是一片和谐的满意之声。丰富的答案只会生成更多问题!根据我的经验,一个问题越容易回答,答案越有价值,生成的问题则越多。尽管机器能够无限拓展答案,我们提出新问题的时间却有限。提出一个好的新问题与吸收一个答案的时间不成正比。与如今的趋势相反,答案将变得廉价,而问题会变得更有价值。巴勃罗·毕加索在1964年就聪明地预测到这个结果。当时,他对作家威廉·费菲尔德(william fifield)说:“计算机是无用的。它们只能给你答案。”
因此,一个到处都是超级智能答案的世界鼓励人们对完美问题的追求。什么才是完美的问题?讽刺的是,最好的问题不是能让我们得到答案的问题,因为随处可见的答案正变得越来越廉价。
一个好问题值得拥有100万种好答案。
一个好问题就像爱因斯坦小时候问自己的:“如果和光线一起旅行,你会看到什么?”这个问题开启了相对论、质能方程e=mc2以及原子时代。
一个好问题不能被立即回答。
一个好问题挑战现存的答案。
一个好问题与能否得到正确答案无关。
一个好问题出现时,你一听见就特别想回答,但在问题提出之前不知道自己对此很关心。
一个好问题创造了新的思维领域。
一个好问题重新构造自己的答案。
一个好问题是科学、技术、艺术、政治、商业领域中创新的种子。一个好问题是探索、设想、猜测,是能带来差异的分歧。
一个好问题处于已知和未知的边缘,既不愚蠢也不显而易见。
一个好问题不能被预测。
一个好问题是机器将要学会的最后一样东西。
一个好问题将代表受教育的头脑。
一个好问题能生成许多其他的好问题。
我们想用问题和答题机器做什么?
我们的社会正在从严格的层级制度向流动的去中心化方向发展。这是一个从名词向动词,从可触摸产品向无形生成物,从固定媒体向混杂媒体,从存储向流动,从确定的答案向不确定的问题转变的过程。当然,我们永远需要事实、秩序以及答案发挥作用。它们并没有离开,而是和微生物以及混凝土材料一样,成为文明的大块基石。但是最宝贵的方面,也就是生活和技术中最活跃、最有价值以及最多产的那一面将位于前沿之中,处在充斥着不确定性、混沌、流动性以及各种问题的边缘地带。能够生成答案的技术将继续得到重视,以至于答案会变得即时、可靠、无所不在,并且几乎免费。但是能够帮助我们生成问题的技术将获得更多青睐。引擎生成了不安于现状的人类能够探索的新领域、新产业、新品牌、新可能性以及“新大陆”,与此相随,提问机器将会适时出现。
提问比回答更有力量。
[1] 世界上最大的奇趣博物馆,位于伦敦,于2008年开业。里面展有来自世界各地的奇趣的人、物,每年都吸引大量游客来此参观。——编者注
第12章 开始 beginning
千年之后,当历史学家回溯过往时,会认为第三个千禧年的开端是一个古老的绝妙时代。在这个时代中,地球上的居民首次把自己与一种巨大的事物相连。未来,它的规模将会继续增加,但是如今,你我正生活在它刚刚苏醒的时刻。未来的人会羡慕我们,希望自己也能亲眼见证它的诞生。这些年里,人类开始用微小的智能让没有生气的物体变得活跃,把它们编织进云端机器智能这张大网中,并将数十亿心智与一个超级心智相连。这个聚拢的过程将被当作这个星球上迄今为止发生的最重要、最复杂也是最令人惊叹的事件。用玻璃、铜和电磁波组成神经,人类这个物种开始将所有的地区、过程、人口、人工制品、传感器、事实和概念编织成一张复杂到难以想象的巨网。在网络的胚胎期,我们的文明中产生了一种协作界面,或者说是一种能超越任何先前发明的能够感觉和认知的设备。可以称之为有机体或机器的这项巨大发明容纳了所有其他的机器,因此,它实际上如此深入地渗透进我们的生活,以至成了与我们身份相关的必要内容。它为我们这样的旧物种提供了一种包括完美的搜索、完整回忆、全球高度的视野在内的新型思考方式,以及一种全新的心智。这是一个开始。
开始的过程将会延续一个世纪之久。前进的道路并不明朗,常常会因为太过平凡而被人忽略。庞大的数据库和广泛的交流本身并没有什么趣味。这个刚刚起步的全球心智的许多荒谬和令人害怕的方面将被淘汰。我们的诸多担心是合理的,因为这股突兀的力量在人类文化甚至自然界当中,几乎无孔不入。然而,由于人类本身就属于这个在更高层级上运作的事物,它正在显现的轮廓变得模糊了。我们唯一知道的是,它在最初阶段就搅乱了旧的秩序。人们对它的强烈反对是意料之中的事情。
我们应当把这个巨大的事物称作什么?它比机器更有生命力吗?在它的核心部位是70亿(不久将变成90亿)的人类。他们很快就被这个从不间断的互联互通的层级包裹,并且,一个人的大脑很快就能和其他人直接连通了。h.g.威尔斯把这个巨大的事物想象成一个世界大脑。德日进(teilhard de chardin)把它称为心智圈 [1] ,即人类思想领域。有人把它叫做全球化心智。因为它确实包含数十亿硅制“神经元”,所以还有人把它比作全球化超级有机体。为了简便一些,我把这种全球级别的层级叫做“霍洛斯”(holos)。霍洛斯包括所有人的集体智能、所有机器的集体行为、自然界的智能相结合形成的整体以及出现在这个整体中的任何行为。这一切加起来就是霍洛斯。
正在生成的事物规模巨大,让人难以理解。它是人类有史以来最大的创造物。让我们以硬件为例。如今,40亿部手机和20亿台计算机连接到一个遍布全球的紧密“大脑皮层”中,其中还有数十亿周边芯片,以及从照相机、汽车直到卫星的附属设备。在2015年,150亿设备接入了一个大型的“大脑回路”之中。任何一个设备都包含100万~400万晶体管,因此,霍洛斯在十万亿亿(1021)晶体管上运行。这些晶体管可以被想象成巨型大脑中的神经元。人类大脑约有860亿神经元,比霍洛斯少了4亿倍。
从数量级来看,霍洛斯的复杂程度已经大大超越了人类大脑。我们大脑的体积不可能几年翻一番,而霍洛斯的大脑却能够做到。
如今,霍洛斯的硬件就像一台巨大的虚拟计算机一样。它包含的芯片数量和一台计算机中的晶体管数量一样多。这台虚拟计算机的顶层功能运行的速度与一台早期个人电脑相当。它每秒能处理100万封电子邮件或100万条信息,这大体上能说明,霍洛斯目前的运行频率为1兆赫。它的外部存储空间总量约为600艾字节。1秒钟内将有10太比特的信息穿过它的“脊柱神经”。它的免疫系统十分强大,能清除主干中的垃圾,并能通过绕开受损部位自行修复系统。
谁在编写代码,让这个全球化系统发挥作用并取得成效呢?答案是人类自身。我们可能会觉得,自己无心地上网浏览或给朋友发东西只是在浪费时间,其实,我们每点击一次链接就强化了霍洛斯大脑中某个节点的功能,其实就是在为他编程。人类通过每天在网页上点击1000亿次来告诉霍洛斯人类的想法是重要的。我们每强化单词之间的一次联系,就是在告诉它一个想法。
这就是我们生活的新平台。它是国际性的,并且永不停止工作。以如今的技术普及速度看来,我预计到2025年,地球上每个公民都将使用这个平台。每个人都处在平台之中,或者说,人人都是这个平台。
这个庞大的全球系统不是乌托邦。即使再过30年,云端中的各种阻拦还将存在,部分内容会被防火墙阻挡、被审查删除或是被盗版。垄断企业将会控制系统的基础结构,但这些互联网巨头脆弱、短命,还容易被竞争对手迅速取代。尽管人们普遍都能获取基本的上网资源,但高级的资源分配是不平均的,并且主要集中在城市地区。富人能够优先获取资源,简而言之,资源的分配和如今的现实世界有异曲同工之妙。不过,资源最匮乏的人也是这个系统的一部分。
现在,在开始阶段,这个不完美的互联网实时覆盖510亿公顷的地面,触及150亿的机器,占据40亿人类的心智,消耗地球上5%的电能,以非人类的速度运行,在白天的一半时间里追踪我们,并且是货币的主要流通渠道。这个组织的规模已经大幅超越了我们目前建造的最大的系统,即各类城市。层级上的跳跃让我们联想到一些物理学家所说的相变,即分子状态的不连续变化,比如从冰到水,或者从水到水蒸气。温度和压力的变化本身并不能带来改变,分子间的基本关系在临界点上发生重组才让物质表现出全新的特性。于是水和冰呈现出两种完全不同的状态。
最初看来,这个规模巨大、无处不相连的新平台就像我们传统社会的自然延伸。它似乎只是在已有的面对面的关系中加入了虚拟关系——我们只是在网上加了几个好友,扩大了朋友圈,增加了新闻的来源,让我们的行动更加数字化。但事实上,就像温度和压力慢慢升高,当这些事情持续稳定地发展,我们会到达一个拐点,或是一个复杂的零界点,在这里,变化是不连续的。于是相变发生了——我们会突然处在全新的阶段。那是一个具有新常态的不同世界。
我们正处在这个过程的开始,那个不连续的变化刚刚露出一些端倪。在新体系中,诸如中央集权以及统一性之类的旧文化力量会消失,而我在本书中描写的分享、使用以及追踪这类新的文化力量将主宰我们的机构和个人生活。当新阶段逐渐稳固,这些新力量的影响将越来越大。有些人认为我们分享的内容已经太多了,但其实大规模分享才刚刚开始。我们从拥有权到使用权的过渡才刚起步。各种各样的“流”都还只是“涓涓小溪”。看上去我们已经被过度追踪,然而未来几十年内,我们被追踪的程度将是现在的千倍;高度的知化会让我们现在从事的最智能的事情看上去十分蠢笨。它同时会大大加速其他变化的进程。而这些转变都不是最终的,只是一个生成过程的第一步。这是一个开始。
从人造卫星拍摄的地球夜晚的照片上,我们能一窥这个巨大机器的模样。骚动的城市群中,耀眼的灯光勾勒出这片黑暗土地上如同有机体的图案。城市边缘的灯光逐渐变暗,只留下细长的高速公路与遥远的城市群相连。向外发散的灯光道路就像树突的形状,让人倍感熟悉。城市群就像神经节细胞,而高速公路则是向突触所在的位置延伸的细胞轴突。城市就是霍洛斯的神经细胞,而我们身处其中。
这个处在胚胎阶段的巨大事物已经至少连续运行了30年。我不知道其他还有哪种机器能够不间断地运行如此漫长的时间。或许它的某个部分会因为供能中断或级联式地感染病毒而暂时停摆,但是,再过几十年,这个整体都不太可能停止运转。它已经成为我们拥有的最可靠的人造物,并且很可能一直保持下去。
这幅正在显现的关于超级有机体的画面让科学家们想到了“奇点”的概念。“奇点”是从物理学借用的一个概念,用来描述一个边界,越过边界一切都是不可知的。在流行文化中则有两种版本:“硬奇点”和“软奇点”。“硬奇点”指的是未来将由超级智能的胜利所奠定。理论上,当我们创造出的人工智能可以创造比自身更聪明的智能时,它就能一代一代地生产越来越聪明的人工智能。事实上,人工智能将会引导自身以级联的方式无限加速生产,使得每一代更聪明的智能都比上一代生产得更快,直到人工智能变得极端聪明,用上帝一般的智慧解决一切现存问题,从而把我们人类远远地甩在身后。有人把这种智能称为我们“最后的发明”。考虑到各种因素,我认为这个设想不太可能实现。
“软奇点”更有可能成为现实。在对未来的这个设想中,人工智能不会像聪明的坏人一样,试图奴役人类。人工智能、机器人、过滤技术、追踪技术以及我在书中列出的其他一切技术将会融合在一起,并且和人类结合,形成一种复杂的依存关系。在这个层级中,许多现象发生的等级将高于现存的生命以及我们的感知水平,而这就是“奇点”出现的标志。这是一种新的系统,在其中,我们创造的东西让自己成为更好的人,同时,我们也离不开自己的发明。如果把我们今天的生活比作固态的,那么这种生活就是液态的,是一种新的相态。
这种相变过程已经开始。人类会紧密相连并汇入一个全球性母体。我们正义无反顾地向着这个方向前进。这个母体不是人造物,而是一种过程。我们的新型超级网络是一股持久变化的浪潮,不断推动着我们的各种新需求和新欲望。我们完全无法预测30年后身边都有哪些产品、品牌和公司。这些完全取决于个人的机遇和命运。但是这个大规模的、充满活力的过程有着清晰无误的整体方向。未来30年,霍洛斯将沿着与过去30年同样的方向挺进,那就是:更多的流动、共享、追踪、使用、互动、屏读、重混、过滤、知化、提问以及形成。我们正站在开始的时刻。
已经开始。当然,也仅仅是个开始。
[1] noosphere,常被翻译为智能圈、心智圈、智慧圈,最早由苏联地球化学家维尔纳茨基提出,指人类活动使生物圈受到影响的部分。德日进发展并普及了这一概念,表示思想、信息和通信的网络包裹着行星。——编者注