我們並不了解自己。通過測量與自身相關的數據揭露我們隱秘的天性,是一項隻有短暫曆史的不凡工作。直到不久前,一個人得絞盡腦汁才能想到辦法測量與自身相關的數據,同時不被自己誤導。用科學方法實現自我追蹤是昂貴、繁瑣、有局限的。但在過去幾年裏,廉價的微型數字傳感器能輕易記錄各類不同的參數,以至於幾乎人人都能測量上千種和自身有關的數據。這些涉及自身的實驗已經開始改變我們對醫療、健康和人類行為的看法。
透過數字技術的魔力,溫度計、心率監測儀、運動追蹤器、腦電波探測儀以及上百種其他的複雜醫療設備都能縮小到和書上的字,甚至標點一樣大。這些肉眼可見的測量設備能夠嵌入手表、衣服、眼鏡、電話,或者是房間、汽車、辦公室以及公共空間這些操作成本不高的地方。
2007年春天,我住在加州北部。一天,我和一位醫生朋友艾倫·格林(n greene)在屋後雜草叢生的小山上徒步旅行。我們一邊沿著泥濘的小路向山頂緩緩行進,一邊討論當時的一項新發明——塞進鞋帶中的微型計步器。它能記錄下每一步,然後將數據儲存到ipod中便於以後分析。我們可以利用這台微型設備計算出爬山消耗的卡路裏,或是追蹤我們一段時間內的鍛煉模式。
一周後,我和《連線》雜誌記者加裏·沃爾夫(gary wolf)又在同樣的地方徒步旅行。他對這些新興自我追蹤裝置的社會意義感到好奇。當時此類設備總共隻有十多種,但我們都預見到,當傳感器不斷變得更智能時,追蹤技術將大行其道。這是一種怎樣的文化趨勢?加裏指出,當我們依賴數字而不是文字時,將構建出一個“量化自我”。2007年6月,加裏和我在網上宣布,將召開一次“量化自我”見麵會,歡迎所有認為自己正在實踐這類行為的人參加。我們沒有給“量化自我”下具體定義,想看看會有哪些人出現。第一次活動中,超過20人來到了我在加州帕西菲卡市的工作室。
他們追蹤的項目種類之多讓我們大吃一驚。他們用可量化的單位測量自己的飲食、體質、睡眠模式、心情、血液因子、基因、地理位置,等等。有些人還自己製造設備。有人為了把力量、耐力、專注力和效率提升到極限,花了5年時間實行自我追蹤。如此進行自我追蹤是一般人難以想象的。今天,全世界有150個量化自我團體,超過30,000名成員。8年以來,每個月都有人在量化自我大會上展示一種之前看來幾乎不可能實現的巧妙新方法,追蹤生活的某個方麵。即便有人因為某種極端的個人習慣顯得格外突出,他的行為不久也會被看作是稀鬆平常的。
計算機科學家拉裏·斯馬爾rry smarr)追蹤了大約100項健康數據,包括他的皮膚溫度、皮膚電反應以及血液生化指標。每個月他都排列出自己糞便中微生物的組成,而這反映了他的腸道微生物係統組成情況。這個領域正迅速成為醫學界最有前景的前沿方向之一。有了這個數據流,再加上大量的業餘醫學調查資料,斯馬爾在沒有醫生提示症狀的情況下,診斷出自己患有克羅恩病(crohn’s disease),或潰瘍性結腸炎。外科手術證實了他的診斷。
斯蒂芬·沃爾夫勒姆是發明mathematica的天才。這是一款智能數學處理軟件(相對於文字處理軟件)。作為一個癡迷數字的人,沃爾夫勒姆將他的計算能力用在了1700萬份與自己生活有關的文件中。他處理了自己25年來收發的所有郵件,還記錄了13年來自己每一次的鍵盤敲擊、通話電話、腳步移動、在家中和辦公室裏的不同房間穿梭的軌跡以及出門後的gps位置。他追蹤了自己寫書和寫文章時修改校訂的次數。借助自己發明的mathematica軟件,他把自我追蹤變成了一種可以展示幾十年來自己日常生活模式的“個人分析”引擎。有些模式是難以察覺的,比如他在分析自身的數據之前並不知道自己在一天中什麽時候效率最高。
設計師尼古拉斯·費爾頓同樣在過去5年裏追蹤並分析自己所有的郵件、信息、臉譜網和推特上的帖子、通話以及旅行記錄。每年他都生成一份年度報告,將前一年的數據結果形象化。2013年,他總結道,自己平均每天有49%的時間是高效的,但星期三效率最高,達到了57%。他的獨處時間占總時間的43%,睡眠時間占總時間的三分之一(32%)。他使用這份定量綜述來幫助自己更好地記憶曾經見過麵的人的名字。
在量化自我會議上,我們看到有人追蹤自己的習慣性拖拉行為、喝咖啡的量、警覺程度以及打噴嚏的次數。老實說,任何可以追蹤的事物都有某個地方的人在進行追蹤。在最近的國際量化自我大會上,我提出了這個挑戰:讓我們想一個最不可能測量的事物,看看有沒有人在追蹤測量。於是我詢問500名自我追蹤者:“有人追蹤自己指甲的生長狀況嗎?”這看上去十分荒唐,但還是有一個人舉起了手。
更微縮的芯片、更強勁的電池以及雲端連接激勵了一些自我追蹤者嚐試時間跨度很長的追蹤,尤其在健康方麵。大多數人每年去醫院檢查一次身體的某些健康指標就不錯了。試想,如果看不見的傳感器每天都測量並記錄你的心率、血壓、溫度、血糖、血清、睡眠模式、體脂、活動水平、心情、心電圖、腦功能等,你會得到關於每項指標的上萬個數據點。你能掌握自己一年中各個時間段、各種狀況下的身體數據,包括放鬆或壓力大時、生病或健康時。幾年後,你就能精確地了解什麽是自己的常態,即指標水平在其中波動的狹小範圍。在醫療中,常態是一個假想的平均狀態。某人的常態並不適用於另一個人,反之亦然。平均的常態對具體某個人來說作用不大。然而,通過長期的自我追蹤,你會得到個人的基準水平,也就是你的常態,當你感覺不舒服或想用自己的身體做實驗時,這個常態會很有價值。
不久的將來,一個極其個人化的身體記錄數據庫(包括完整的基因序列)可以用來打造個人治療方案和個性化醫療。科學能夠通過你生活的日誌,為你專門生成治療方案。例如,家裏的一台智能的個性化製丸機能夠完全按照你當前的身體狀況把藥物進行混合。如果早上的治療減緩了症狀,係統還會調整晚上的劑量。
目前,標準的醫學研究方法就是在盡可能多的受試者身上做實驗。受試者數量(n)越多,研究效果將越好。當n等於100000的隨機人群時,我們才能根據實驗結論推測一個國家的狀況,因為此時受試人群中的離群個體對結果的影響在經過平均後能夠消除。事實上,由於經濟原因,大多數醫學實驗的參與者都不到500人。當然,科研中的n=500時,如果操作謹慎,就能通過藥物批準。
另一方麵,如果一項量化自我的實驗中的n隻有1,受試者就是你自己。你開始可能會覺得n=1的實驗在科學上是無效的,但是這對你個人來說是極其有效的。從多方麵看來,這是一個理想實驗,因為你所測試的變量x是特定對象,即你的身體和心智在某一時刻的即時狀況。誰會關心治療是否對他人有效呢?如果想了解治療是否對你有效,那麽一個n=1的實驗提供的結果完全適用。
n=1的實驗(是科學時代之前所有醫療的標準程序)真正的問題不在於它的結果沒什麽用處(其實是有用的),而在於它很容易誤導你自己。我們對於身體、食物、世界的運作(例如蒸發理論、振動理論和細菌理論)都有直覺和期望,而這些會讓我們忽視真正發生的事情。我們猜測瘧疾是空氣不好導致的,於是搬到更高的地方住,這確實帶來了些許改善。我們猜測麩質會導致臃腫,於是傾向於找到生活中支持這項猜測的證據而忽視那些認為麩質和臃腫無關的反麵證據。受到傷害或感到絕望時,人們尤其容易受偏見影響。n=1的實驗要想成功,必須將測試者的期望和受試者的期望分開,但由於一個人同時具有兩種身份,這是極其困難的。為了克服這種固有的偏見,人們發明了大量受試者參與的隨機雙盲測試 [1] 。由於受試者不知道他們的測試考察的是什麽,因此不可能帶有偏見。在自我追蹤的新時代中,我們用自動化裝置克服部分n=1的實驗中自我誤導的問題(在傳感器長時間的多次測量中,受試者會“忘記”測試這回事)。我們還能追蹤多個變量從而分散受試者的注意力,然後使用統計工具嚐試發掘出模式。
從許多針對大數量總體的傳統研究中我們了解到,治療起作用常常是因為我們相信它有作用。這又被稱作安慰劑效應。這些量化自我的追蹤並不完全拒絕安慰劑效應,它們反而與安慰劑效應共同起作用。如果幹預過程帶來了可測量的改善,那麽它就是有效的。我們關心的不是這種改善是否來自安慰劑效應,而是它能否對這個唯一的受試者起作用。因此,安慰劑效應可以是正麵的。
在正式研究中,你需要一個對照組來抵消對於正麵結果的偏見。在n=1的實驗中,量化自我實驗者,用自身的基準水平代替對照組。如果你追蹤自己的時間足夠長,指標足夠多,就能在實驗之外(或之前)建立你的表現模式,在對比時可以作為對照組有效地使用。
這些關於數字的討論都掩蓋了一個關於人類的事實:我們的數學直覺很差。人類的大腦不擅長統計。數學不是我們天生的語言。甚至在解讀非常形象化的圖表以及數值圖時我們也需要高度集中注意力。從長遠看,量化自我過程中的量化成分會變得不明顯。自我追蹤將遠遠超越數字化的範疇。
舉個例子,2004年,德國的信息技術經理烏多·瓦赫特(udowachter)把一個小數字羅盤的內芯取出來焊接到一條皮帶上。他繞皮帶一圈埋入了13條壓電振子,也就是讓智能手機振動的零件。最後,他入侵電子羅盤的係統,讓它不在圓形屏幕上顯示北的方向,而是讓連成一圈的皮帶的不同部位產生振動。皮帶上“對著”北方的部位會一直振動。當烏多係上皮帶後,他就能通過腰部感受北的方位。不到一周時間,他對北的方位感覺就準確無誤了。他不用思考就能指出北的方向,他是無意識的,但就是知道。幾周後,他的位置感得到了增強,就好像他能感覺到一座城市的地圖。數字追蹤產生的量化信息被結合到了全新的身體感覺之中。長遠看來,這是我們身體傳感器中許多數據流的最終歸宿,它們將不再是數字,而是新的身體感覺。
這些新的合成感覺不僅僅是娛樂性的。我們的自然感覺在數百萬年的演化過程中確保了我們可以在一個匱乏的世界生存。沒有足夠的能量、鹽或脂肪對我們是殘酷的威脅。馬爾薩斯和達爾文指出,每個生物種群都會擴張到將要發生饑荒的極限。今天,在技術帶來的富足世界中,生存的威脅來自過量的菁華物質。太多的菁華打破了我們新陳代謝和心理的平衡。而我們的身體還不太能留意到新的失衡狀況。演化過程中,我們不能夠感覺到血壓和血糖水平。但是技術能做到。比如,scanadu的scout這個新型自我追蹤設備,尺寸和瓶蓋一樣,隻要用它接觸你的前額,它就會一次性測量出你的血壓、變化的心率、心髒功能(心電圖)、氧水平、體溫和皮膚電傳導。不久它也將能測量你的血糖水平。最終你會把它穿戴在身上。這些信息不以數字形式而是以我們能感覺的方式反饋給我們,比如腰部的振動、臀部的擠壓。設備會讓我們獲得對於身體的新感覺,這是我們沒有演化出來但卻亟需的感覺。
自我追蹤的範疇遠遠大於健康。它涵蓋了我們的整個生活。微型可穿戴的數字“眼睛”和“耳朵”能夠記錄我們一天中每分每秒的所見所聞,從而幫助我們記憶。我們儲存的一連串電子郵件和信息構成了記錄自身想法的日誌。我們還可以記錄聽過的音樂、讀過的書和文章以及去過的地方。我們日常的走動和會麵,以及非常規的事件和經驗中的重要細節,也能被數據化,並匯集成基於時間順序的流動信息。
這種流動信息被稱作“生活流”(lifestream)。計算機科學家大衛·格勒恩特(david gelernter)於1999年首先描述了這個詞。他構想的“生活流”不光是一個數據檔案,還是一種新型的計算機界麵組織方式。基於時間順序的“流”將代替桌麵,而“流瀏覽器”將代替網頁瀏覽器。格勒恩特這樣定義“生活流”的架構: <blockquote>
“生活流”是按時間順序排列的文檔“流“,相當於你的電子化生活日記。你建立和收到的所有文檔都會被儲存在你的“生活流”中。“流”的底端是過去的信息(從你的電子出生證明開始)。遠離底端,也就是向現在的方向移動,“流”更多地包含最近的文檔,比如圖片、通信、賬單、電影、語音信息、軟件等。從現在向未來的方向移動,“流”包含著你將來需要的文檔:提醒、日曆項目、待辦事項。想象一下,有一本日誌會自動翻頁,能追蹤你生活中的每一個瞬間。你可以坐等新文檔的到來,它們會落在“流”的前端位置。向下移動指針瀏覽你的“流”,或點一下屏幕上的文檔,彈出的頁麵包含文檔的內容。你可以往回查看或看一看未來一周甚至十年應該做什麽。你的整個計算機網絡人生會呈現你的麵前。 </blockquote>
每個人都會生成自己的“生活流”。當我遇見你時,我們的“生活流”就在某個時刻發生了交集。如果我們預備下周見麵,交集將發生在未來;如果我們去年見過麵或出現在一張照片裏,那麽交集發生在過去。豐富的交織關係讓我們的“流”變得異常複雜,但是每個人的“流”都嚴格遵照時間順序,因而非常容易導航。我們會自然而然沿著時間線定位一個事件。比如“這發生在聖誕旅行之後,但在我的生日之前”。
關於“生活流”作為一種結構性隱喻的好處,格勒恩特說:“‘我把這條信息放在哪兒了’這個問題,總是隻有一個準確的答案——在我的‘流’中。與文檔層級相比,時間線、紀年表、日記、日報、剪貼簿這些概念在人類的文化和曆史中更加根深蒂固。”格勒恩特對一名sun公司的計算機代表說:“當我獲得一段新的記憶——比如,某個陽光明媚的下午與梅麗莎在‘紅鸚鵡’酒店外的一次交談——我不用命名這段記憶或是把它塞在某個目錄下。我可以使用記憶中的任何內容作為檢索的關鍵詞。我也不需要命名電子文檔,或把它們放進目錄。我隻要獲得他人的許可,就能把他人的‘流’混入我的‘流’中。反映我電子生活的個人‘流’可能混入包括我所屬團體或組織的其他‘流’。最終,我的‘流’中還將混入諸如報紙、雜誌等各種類型的‘流’。”
從1999年開始,格勒恩特多次嚐試開發其軟件的商業版本,但一直未能成功。一家購買了格勒恩特專利的公司曾起訴“蘋果”公司,認為“蘋果”盜用“生活流”的想法並用在自家的“時間機器”備份係統上(在“蘋果”的時間機器上,要想恢複一份文件,你隻要滾動時間線,回到需要的日期,就能得到包含當時計算機上所有內容的“快照”)。最近,格勒恩特和兒子丹尼爾再次嚐試開發一款運用“生活流”的商業化產品,叫做dittach [2] 。
事實上,我們已經在使用一款(至少部分包含)“生活流”產品,那就是臉譜網。你的臉譜網“流”是包括照片、新消息、鏈接、提醒以及生活中其他文件在內的流動信息。新的內容被不斷地添加到“流”的前端。如果願意,你可以在臉譜網中加入能捕捉你正在聽的音樂或正在播放的電影的小控件。臉譜網還提供了時間線界麵,方便你回顧過去。超過十億人的“流”能與你發生交集。朋友或陌生人在帖子上點“讚”或標記出照片中的一個人,兩股“流”就有了交叉。每天,臉譜網都在把更多時事或新聞“流”以及公司快訊加入“世界流”之中。
但這些隻是部分內容。“生活流”是一種主動且有意識的追蹤。當人們從相機中抓取照片、標記朋友或是刻意在“四方網” [3] (foursquare)上的某個地點簽到時,他們就在主動地管理自己的“流”。甚至他們的fitbit [4] 數據,包括步數計算,也都是主動的,因為這些數據存在的目的就是想獲得人們的關注。如果不進行某種程度上的關注,你就不能改變自己的行為。
無意識且不主動的追蹤同樣重要。這種被動的追蹤方式有時被稱作“生活記錄”(lifelogging),也就是簡單、機械、不動腦筋地完整記錄下一切,或者說不偏不倚地記錄生活中所有可記錄的事物。你將來可能會用到它時才去關注它。由於大部分內容永遠都用不上,“生活記錄”是一個包含巨大浪費的低效過程。今天,由於計算、存儲和傳感器設備十分廉價,這種浪費幾乎沒什麽代價。但是,對於計算的創造性“浪費”是許多最成功的數碼產品和公司的“秘方”。“生活記錄”的優勢同樣在於它對計算的奢侈使用。
最早進行“生活記錄”的人之一是20世紀80年代中期的泰德·尼爾森(ted nelson)(盡管他當時並沒有這個概念)。發明了術語“超文本”的尼爾森把自己與任何人在各地發生的對話用錄音帶或錄像帶記錄下來,這些對話的重要程度各不相同。因為和上千人見麵及交談,於是他租來一個大型集裝箱,裏麵塞滿了帶子。他的後繼者,90年代麻省理工學院(如今在多倫多大學)的斯蒂夫·曼(steve mann)用一個頭戴式攝像機記錄自己的日常生活。25年來,攝像機在他醒著的時候一直開著,記錄下一年到頭來每天發生的事情。他的裝置在一隻眼睛的上方包含一個微型屏幕,而鏡頭能從第一人稱視角進行記錄,預示著20多年後穀歌眼鏡(google ss)的誕生。由於相機遮住了他的半邊臉,周圍人會感到不自在,但他還是無意識地隨時記錄自己的整個生活。
當然,微軟研究院的戈登·貝爾(gordon bell)或許才是模範的“生活記錄”實踐者。從2000年開始的6年裏,貝爾在一項被他稱為mylifebits的大型實驗中,記錄下自己工作的方方麵麵。貝爾脖子上戴著一個特製的微型攝像機,它能注意到附近人的身體熱量,並且每60秒拍攝他們一次。貝爾的身體相機在檢測到光線發生變化時,也會拍下一張照片。貝爾記錄並儲存自己在電腦上的每次敲擊、每封郵件、每個訪問過的網站、電腦上的每個窗口以及它們打開的時間。他還記錄了自己的許多對話,過去說過的話與別人產生分歧時,可以“回滾”或倒帶查看。他還把收到的所有文件掃描成數字文檔,並在征得當事人同意的情況下把所有電話交流記錄下來。這項實驗的初衷,部分在於微軟想找出用來幫助員工管理生成的海量數據的某種“生活記錄”工具,因為解釋這些數據遠比僅僅記錄它們更有挑戰。
創建完整的回憶是“生活記錄”的重點。一份“生活記錄”記載了生活中的每件事,因此它能幫你恢複那些大腦可能忘記的事情。當生活被附上索引並完全儲存在“生活記錄”中時,你就能像使用穀歌那樣搜索你的生活。我們的生物記憶力十分不穩定,因此任何補償都有巨大作用。貝爾的實驗版完整回憶工具幫助他提高效率。它能從以前的對話中驗明真相或者重獲自己忘記的見解。在他的係統中,將生活轉換成數字化記錄不成問題,但是讀取有意義的數據需要更好的工具。
受到戈登·貝爾的影響,我在襯衫上夾著一個微型相機。這款narrative相機的大小約1平方英寸。隻要戴上相機,它每分鍾都會拍攝一張照片。如果輕觸兩下機身,它就會拍攝一次。照片在雲端進行處理,然後發回手機或存在網上。narrative的軟件能按一天中的生活場景智能分類圖片,並在一個場景中選擇最具代表性的三張照片,這樣大大減少了照片傳輸量。使用照片概覽,我可以先快速瀏覽一天內的2000多張照片,接著展開某個具體場景找到我想要的某個瞬間。我可以在1分鍾內輕鬆地瀏覽一天的“生活流”。
雖然照片的分辨率夠高,效果也很自然,但是因為沒有構圖(鏡頭隨衣服移動),並且是“隨機”拍攝,因此不適合分享。人們可能沒被拍到頭部,或是在眨眼睛,又或者被一張隨機的房間圖擠掉,更別說拍出文藝範了。這種“生活記錄”類的照片作為詳盡的視覺日誌,一個月中隻要產生幾張有價值的照片就足夠了。
narrative公司發現,典型的用戶在參加會議、度假或是想記錄一段經曆時會使用他們的產品,其中重現會議場景的效果最理想。持續拍攝的相機能夠捕捉很多初次見麵的人,而多年後你隻要瀏覽一下自己的“生活流”,很容易就能想起他們以及他們說過的話,比名片更好用。“生活流”照片能有效地提示我們有關度假的回憶以及家庭生活中的大事。例如,我最近就在外甥的婚禮上使用了narrative相機。我的記錄不僅包括了人人分享的標誌性時刻,還有與陌生人之間的對話。這一代narrative相機不能保存聲音,但是下一代產品將包含錄音功能。貝爾在研究中發現,信息量最大的媒體是有照片作為提示和索引的音頻信息。
使用拓展版的“生活記錄”有這四條好處:
·它能365天、一周7天、每天24小時地全時段監控身體測量數據。想象一下,如果我們持續地對血糖水平進行實時監控,公共醫療會發生怎樣的變化?如果你能實時監控是否有生化物質或毒素從周圍環境進入血液中,你的行為將發生怎樣的變化?(你或許會說:“我再也不想回到這裏!”)這些數據既可以作為預警係統,也可以作為診斷疾病或用藥的依據。
·它能提供包括你遇見的人、和他人的對話、去過的地方、參與過的事件在內的互動記憶。你可以搜索、獲取或是分享這些記憶。
·它能提供包括所有你生產的東西、寫下的文字或說過的話在內的完整存檔。深層次的分析能夠幫助你提升效率和創造力。
·它能提供一種組織、構造以及解讀你自身生活的方式。
隻要分享“生活記錄”,我們就能利用信息檔案協助他人工作以及擴大人脈。在生物領域,分享醫療日誌能迅速加快醫療發現的進程。
許多懷疑者認為,兩大挑戰讓“生活記錄”注定隻能在小範圍內流行。
首先,目前的社會壓力讓自我追蹤看上去是件十分怪異的事。擁有穀歌眼鏡的人不喜歡自己戴眼鏡的樣子,並且和朋友在一起時用眼鏡進行記錄,甚至解釋自己為什麽不記錄都讓他們感到不適,於是很快把眼鏡丟在一邊。就像加裏·沃爾夫所說:“在日記本上寫日記值得欽佩,但在電子表格上寫日記讓人起雞皮疙瘩。”但我相信,我們很快會發明新的社會規範和技術革新來確定“生活記錄”在哪些情況下是合適的。20世紀90年代,當最早的一批人開始使用手提電話時,刺耳的電話鈴聲著實可怕。在火車上、浴室中或電影院裏,手提電話發出高分貝的刺耳聲響;通話時,人們扯著嗓子,說話聲與鈴聲一樣大。如果當時的人設想人人擁有手機的未來生活,腦中隻會浮現一個永不消停的喧鬧世界。如今我去看電影時,即便周圍人都有手機,也不會聽到鈴聲,甚至看不見發光的屏幕,因為這些事情被認為是不合適的。我們會發展出類似的社會習俗以及技術解決方案,讓人們接受“生活記錄”。
其次,當每個人每年產生的數據量達到拍字節或艾字節,而“生活記錄”如何發揮作用呢?沒人能遍覽這海量的數據,你將毫無頭緒地淹沒在數據的海洋中。如今的軟件大致都存在這個問題。解釋數據是一項極其耗時的工作,你必須精通計算,技術熟練並且充滿動力才能從數據長流中萃取有意義的信息。所以,自我追蹤仍是小眾的活動。然而,廉價的人工智能將能克服大部分問題。研究實驗室中的人工智能已經能夠篩選億萬條記錄,讓有意義的重要模式顯現出來。舉個例子,隻要價格便宜,穀歌用來描述一張隨機照片內容的人工智能技術可以被拿來解讀我襯衫上的narrative相機裏的照片。我隻要用最簡單的語言詢問narrative相機,它就能尋找多年前我參加的聚會上某個戴著海盜帽的家夥,如果確有其人,那麽我們倆的“流”也將發生聯係。或者我還可以詢問自己待在哪些房間時心跳會加快,影響因素是房間的顏色、室內的溫度還是天花板高度?這些現在看起來有些奇特的要求在10年後,將會是很平常的機械命令,就像如今司空見慣的穀歌搜索在20年前看來很神奇。
然而,這些還不夠全麵。我們作為網絡中的人,會進行自我追蹤,並且大多數人都會追蹤自己的生活。但是網絡上除了人,還有更多的事物,數以億計的事物也會追蹤自己。幾十年後,任何被生產出來的東西都將包含一塊能聯網的芯片。廣泛聯網帶來的一個結果就是,我們可以精確地追蹤一樣東西是如何被使用的。例如,從2006年開始,每輛出廠轎車都在儀表盤下裝有一塊omb芯片,用來記錄車的使用情況。它會追蹤汽車的行駛裏程、車速、急刹次數、過彎速度以及油耗。最初設計這些數據是用來協助車輛的維修。如果你願意提供omb駕駛記錄,一些保險商,如progressive公司會降低你的汽車保險費用。駕駛方式越安全的人支付的費用越低。汽車的gps定位也能被準確追蹤,因此駕駛員在哪些道路上行駛以及行駛的頻率可以成為征稅的依據。我們可以把這種道路使用費看作虛擬收費站或是自動征稅。
物聯網的設計是用來追蹤數據,這也是它所處的雲端的本質屬性。在未來5年中,我們預計雲端中加入的340億聯網設備將會用來傳輸數據。雲端的作用則是保存數據。任何接觸雲端的東西都能被追蹤,也一定會被追蹤。
最近,在研究員卡米爾·哈特塞爾(camille hartsell)的幫助下,我整理搜集了美國所有對我們進行常規追蹤的設備和係統的清單。這裏的關鍵詞是“常規”。我排除了那些黑客、罪犯或網絡部隊使用的非常規的追蹤手段。我還略過了美國政府部門想要追蹤某些特定目標時運用的手段(政府的追蹤能力和他們的預算成正比)。這張清單包含了一個普通人在平常的生活中可能遇到的追蹤手段。每個例子都有官方來源,或是出現在主流出版物上。
汽車活動——從2006年開始,每輛車都包含一塊芯片。當你發動汽車時,它就開始記錄車速、刹車、過彎、裏程、事故等狀況。
高速公路交通——高速公路上的柱子和測速器上安裝的攝像頭通過車牌和快速追蹤標誌記錄汽車的位置。每月有7000萬個車牌被記錄。
拚車軟件——優步、lyft和其他零散的打車軟件記錄你的旅程。
長途旅行——你的航空和鐵路行程被記錄。
無人偵察機——“捕食者”無人偵察機監控美國邊境的活動。
郵政信件——你寄出或收到的每封信的表麵信息都被掃描並數字化了。
公用設施——你的用水和用電模式都被公共設備記錄了(目前沒有垃圾分類信息)。
手機位置和通話記錄——你通話的時間、地點和對象(元數據)會被儲存數月。有些手機供應商通常會把信息和電話的內容儲存幾天到幾年不等。
民用攝像頭——在大多數美國城市的中心地帶,攝像頭24小時不間斷地記錄你的活動。
商業和私人空間——如今,68%的公立機構主管、59%的私人企業主、98%的銀行工作人員、64%的公立學校人員以及16%的業主在攝像頭下生活或工作。
智能家居——智能恒溫調節器(如nest)檢測你是否在家,同時記錄你的行為模式,並將這些數據傳輸到雲端。智能插座(如belkin)監控你的用電量和用電時間並把數據分享到雲端。
家居監控——視頻攝像頭記錄你在家裏或四周的活動,將數據儲存在雲端服務器。
互動設備——你傳達給手機(siri,now,contana)、主機(kinect)或環境話筒(亞馬遜echo)的語音命令和信息在雲端被記錄和處理。
商場會員卡——超市能追蹤你購買的物品。
電子零售商——亞馬遜之類的零售商不僅追蹤你購買的東西,還有你瀏覽或想買的東西。
美國國家稅務局(irs)——國稅局追蹤你一生的財務狀況。
信用卡——顯然,所有的購買行為都被追蹤了。信用卡和複雜的人工智能相結合形成模式,揭示你的人格、種族、癖好、政治觀點和愛好。
電子錢包和電子銀行——諸如mint一類的信息采集組織追蹤你的貸款、房貸以及投資等完整的財務狀況。類似square和paypal這樣的錢包軟件追蹤你的購買情況。
人臉識別——臉譜網能在他人上傳的照片中辨認(標記)你的頭像。照片的拍攝地點代表了你過去所處的位置。
網絡活動——網頁廣告cookie追蹤你上網時的舉動。上千家頂尖網站中有80%利用網頁cookies追蹤你在網上的行蹤。通過與廣告網絡(aworks)的合約,你沒有訪問過的網站也能得到你的瀏覽曆史。
社交媒體——它們能辨認你的家庭成員、朋友以及朋友的朋友,還能追蹤你以前的老板以及現在同事,也能了解你如何度過閑暇時間。
搜索瀏覽器——穀歌默認永久記錄你查詢過的所有問題。
流媒體服務——他們能追蹤你看過哪些電影flix)、音樂(spotify)、視頻(youtube)以及你的評論時間和內容。有線電視公司會記錄你的觀看曆史。
讀書——公共圖書館會保存你的借書記錄一個月。亞馬遜永久儲存你的購買曆史。kindle監控你的電子書閱讀模式,包括你的閱讀進度、閱讀每頁的耗時以及停止閱讀的位置。
健康追蹤——你進行身體活動的時間、地點通常會被24小時不間斷記錄,其中還包括每天睡覺和起床的時間。
很容易設想,能夠整合所有這些“流”的機構將擁有多麽巨大的權力。因為聚集這些內容在技術上十分便利,人們會害怕“老大哥”的到來。當然,目前大多數“流”都是獨立的,數據並沒有被整合或關聯。其中,幾類數據可能被捆綁在一起(比如信用卡和媒體的使用),但總體看來,不存在類似“老大哥”的大規模整合“流”。政府行動緩慢,因此其作為遠遠落後於技術上能達到的程度(他們自身的安全措施落後幾十年)。還有隱私法案這道來之不易的“薄牆”,阻止了美國政府整合這些“流”的行動。然而,企業整合數據的行為幾乎不受法律製約,因此許多公司成了政府的數據收集代理方。客戶的數據是商場中的新財富,因此可以肯定:公司(和間接意義上的政府)將收集更多數據。
根據菲利普·k·迪克的短篇小說改編的電影《少數派報告》,描述了一個不太遙遠的未來社會,其中監控係統能在罪犯作案前將他們抓獲。迪克稱這種幹預為“預防犯罪”偵查。我曾經認為迪克“預防犯罪”的概念是不現實的,現在我不這麽想了。
根據上麵的常規追蹤清單,我們不難推斷未來50年的情況。所有先前無法測量的東西都被量化、數字化,並且可以被追蹤。我們會持續追蹤自己,我們和朋友之間也會互相追蹤。企業和政府會對我們實行更多追蹤。50年後,無處不在的追蹤行為將成為常規。
我在先前的章節“使用”中提到,互聯網是世界上最大、最快的“複印機”,任何接觸到互聯網的事物都會被複製。互聯網想要生產更多複製品。起初,這個事實讓原創個人和公司深感麻煩,因為他們的作品通常會被不加區分地免費複製,而有些東西原本是珍稀的。有人(最容易想到電影工作室和唱片品牌)反抗這種偏好,而另一些人選擇順應這種偏好。擁抱互聯網對複製的偏好,並尋求難以被複製的價值(例如,通過個性化、實體化、權威性獲得價值)的人會獲得成功,而否認、禁止以及試圖貶低複製渴望的人則落後了,將來需要試圖趕上。消費者當然喜歡各種混雜的複製品,同時還通過為互聯網提供內容獲得好處。
對複製的偏好不僅受文化和社會影響,還是由技術決定的。這種偏好在命令經濟中,在不同的社會背景下,甚至在另一個星球上也是成立的。既然我們無法停止複製,那麽圍繞無處不在的複製的法律和社會體製十分重要。我們如何處理創新、知識產權和責任、對複製品的擁有權和獲取將會極大地影響社會的繁榮和幸福。無處不在的複製是必然的,但是我們可以對其具有的特征做出重要決定。
追蹤也遵循類似的必然變化。把上文中的“複製”換成“追蹤”就能把兩者進行對比:
互聯網是世界上最大、最快的追蹤機器,任何接觸到互聯網的事物都可以,且都會被追蹤。互聯網想要追蹤所有事物。我們將不斷地追蹤自己,追蹤朋友以及被朋友、公司和政府追蹤。追蹤曾經是不常見的昂貴行為,因此給公民帶來深深的困擾,並且一定程度上來說對公司同樣如此。一些人全力對抗對於追蹤的偏好,另一些人最終會順應這種偏好。我相信試圖將其規範化、民用化,以及讓它更有效的人將會獲得成功,而試圖禁止它,利用法律排斥它的人將會落後。消費者說,自己不願意被追蹤,但他們其實不斷提供數據給這台機器,因為他們想從中獲得好處。
對追蹤的偏好不僅受文化和社會影響,還是由技術決定的。這種偏好在命令經濟中,在不同的社會背景下,甚至在另一個星球上也是成立的。既然無法停止追蹤,那麽圍繞無處不在的追蹤的法律和社會體製十分重要。無處不在的追蹤是必然的,但是我們可以對其具有的特征做出重要決定。
這個星球上增長最快的就是我們生產的信息量。幾十年間,信息的膨脹速度比其他任何事物都要快。信息的積累速度比混凝土用量的增長速度(7%的年增長率)更快,比智能手機或芯片出口的增長速度更快,比汙染或二氧化碳這類副產品的產生速度更快。
加州大學伯克利分校的兩位經濟學家統計了全球信息生產量,計算出新信息正以每年66%速率增長。雖然這算不上天文數字,甚至趕不上ipods 2005年600%的增長量。但是這種激增是短暫的,不會維持數十年(ipod在2009年停產)。另一方麵,信息的增長已經持續了至少一個世紀。66%的年增長速度相當於每18個月翻一番,正符合摩爾定律規定的速率。到5年前為止,人類儲存了數百艾字節的信息,相當於地球上的每個人擁有80座亞曆山大圖書館。而今天的信息量相當於每人擁有320座圖書館。
用信息爆炸來描述這種增長是另一種將其形象化的方式。全世界每秒鍾生產6000平方米的信息存儲材料,包括光盤、芯片、dvd、紙張、膠片,我們會將數據填在其中。6000平方米每秒的速率大致相當於原子彈爆炸產生的衝擊波傳播的速度。信息以類似核爆的方式膨脹。但與真正的原子彈爆炸不同,信息爆炸不會隻持續數秒,而會一直進行下去,好比一場持續幾十年的核爆。
然而,我們日常生活中產生的大部分信息都沒有被捕捉或記錄。盡管追蹤和存儲量呈爆炸性增長,日常生活的主要內容並沒有被數字化。這些沒有被計算在內的信息是“未開發”或是在“暗處”的信息。開發這些信息將確保我們的信息總量在未來幾十年內不斷翻倍。
我們會生產關於信息的信息,這導致了每年收集到的信息量不斷增加。這類關於信息的信息被稱為元信息(meta-information)。我們捕捉到的所有數字信息都將促進我們生產與其相關的信息。當我們手臂上的運動手環捕捉到我們行走了一步,就會立即添加一個時間標記數據,接著它會生產更多新信息把這個數據和其他步數信息聯係在一起,而當這些時間標記數據被繪製成圖表時,又生成了大量新數據。與此類似,當一個年輕女孩在直播視頻中彈奏電吉他時,以捕捉到的音樂數據為基礎,產生了關於這個視頻片段的索引數據,點“讚”的數據信息以及與朋友分享後包含的複雜信息包。捕捉的數據越多,我們基於數據生產的數據就越多。這類元數據的增長速度甚至超過基礎信息,並且它的規模幾乎是無限的。
元數據是一種新的財富,因為比特與其他比特發生關聯時,價值就會提升。比特最低效的呈現方式就是單獨且直接地存在。沒有被複製、分享或是與其他比特相關聯的比特將是短命的。比特最糟糕的未來就是待在某個黑暗、與世隔絕的墓穴之中。它們真正想要的是與其他比特一起出去逛逛、被廣泛複製、成為元比特或是一條連續代碼中的行動比特。我們可以用擬人的方法這樣描述:
比特想要移動。
比特想要與其他比特發生關聯。
比特想要被實時測算出來。
比特想要被重複、複製和複印。
比特想要成為元比特。
當然這是純粹的擬人手法,因為比特是沒有意誌的,但它們有傾向。與其他比特關聯的比特將傾向於被更多地複製。就像自私的基因傾向於自我複製,比特也是如此。同理,就像基因“想要”能夠幫助它們自我複製的身體編碼,自私的比特也“想要”幫助他們複製和傳播的係統。比特的行為方式讓它們看上去想要自我複製、移動以及被分享。如果你想依靠比特完成任何事,最好明白這一點。
因為比特想要被重複、複製以及被鏈接,信息爆炸和科幻小說級別的追蹤將不會停止。人類想要得到的很多好處來自於數據流之中。目前最主要的問題是:我們想要選擇哪種全麵追蹤的方式?“他們”了解我們,而我們對“他們”一無所知,我們想要這種單向的環形監獄式的追蹤嗎?或者我們可以建立一個互動、透明的“互相監督”機製,其中包含對監督者的監督?第一個選擇是地獄,第二個則容易駕馭。
從前的小鎮就是標準的情形。街對麵的女士會追蹤你的一舉一動。她透過窗戶瞥一眼,就知道你什麽時候去看病,什麽時候買了一台新電視以及誰周末和誰待在一起。同樣,你也透過窗戶看她,知道她周四晚上幹什麽,在街角的藥店把什麽東西放進籃子裏。互相監督對雙方都有好處。如果她不認識的人趁你不在時進入你家,她就會報警。當天她不在家時,你會幫她查收郵箱中的信件。小鎮上的互相監督是對稱的,所以有效。你知道誰在看你,知道他們如何使用你的信息。信息是否準確,使用是否得體,你都可以向他們問責。受監督時,你也可以從中得利。最終,人們的處境是一致的。
今天我們被追蹤時會感到不適,是因為我們不清楚誰在監督我們,以及他們知道多少信息。我們無法決定他們如何運用我們的信息。信息需要糾正時,我們無法向他們問責。他們記錄我們時,我們無法記錄他們。並且被監督能得到哪些好處並不明朗。彼此的關係是不平衡、不對稱的。
無處不在的監督是必然的。因為我們無法讓這個機製停止追蹤,我們隻能讓人們之間的關係更對稱。實現文明的互相監督需要技術的修補和新的社會準則。科幻小說家大衛·布林(david brin)用他的書名《透明社會》(transparent society)形容這樣的世界。這種設想如何運作呢?考慮一下我在“分享”那一章中描述的去中心化的開源通貨——比特幣。比特幣將經濟體中的每一筆交易公開記錄在一本公共賬目上,使得所有的金融交易公開透明。交易的有效性由用戶之間的相互監督而不是中央銀行的監督實現。還有一個例子,一種開放式的加密軟件pgp [5] 基於任何人都能查看的代碼,包括一個公鑰,因此人人都可以信任並驗證。這些創新發明沒有補救現存的信息不對稱的問題,卻展示了由相互警惕的機製驅動的體係如何運行。
互相監督的社會中會出現一種權利意識,即每個人都有權獲取關於自己的數據,並從中受益。但是每種權利都伴隨著義務,因此每個人都有義務尊重信息的完整,負責任地分享信息並接受他人監督。
用法律限製追蹤的擴張或許就像用法律禁止複製一樣無效。我是泄露上萬份美國國家安全局機密文件的檢舉人愛德華·斯諾登的粉絲,因為我認為包括美國政府在內的許多政府最大的過失就是隱瞞它們實行追蹤的事實。強大的政府在追蹤我們,並且這種追蹤完全不對稱。我為斯諾登的檢舉叫好不是因為它會減少追蹤行為,而是因為它能增加透明度。如果我們能讓追蹤重新變得對稱,可以追蹤那些追蹤我們的人;如果我們能讓追蹤者負法律責任(應當出台相關法規),並且為信息的準確性負責;如果我們能讓利益更明顯且與我們更相關,那麽我想追蹤的擴張將是可以接受的。
我希望朋友把自己當個體看待,為了建立這樣一種關係,我必須保持開放和透明,並和他們分享我的生活。我也希望公司將我當個體看待,因此我必須保持開放、透明並與它們分享信息。我還希望政府把我當個體看待,因此我必須向它們公開個人信息。個人化和透明度之間有一種對應關係,個人化程度越高所需的透明度就越高。絕對的個人化(虛榮)需要絕對的透明度(無隱私)。如果寧願保持隱私,不對朋友和機構開放自己,那麽我必須接受個性不受重視的一般化對待。我將成為一個平均數。
現在,想象一下這些選項被固定在一根滑動軌道的兩端,左端是個性化和透明,右端是隱私和一般化。滑塊可以向兩邊或中間的任何位置滑動,而這個位置代表我們重要的選擇權。讓人人都感到意外的是,當技術讓我們進行選擇(保有選擇權十分重要)時,人們傾向於將滑塊推向個性化和透明的那端。心理學家在20年前不可能預料到這一點。如果今天的社會媒體教會我們一些關於人類的東西,那就是人類分享的衝動勝過保持隱私的願望。這讓專家們感到驚訝。至今為止,當麵臨選擇的時候,我們一般傾向於更多地分享、揭露以及變得更加透明。我會這樣總結:虛榮戰勝了隱私。
人類曾經世世代代生活在部落或宗族之中,那時我們所有的行動都是公開、可見的,沒有秘密可言。我們的心智在持續的互相監督下演化。從演化角度來說,互相監督是我們的本性狀態。我認為,與諸多現代懷疑態度相反,人與人之間形成循環監督的世界不會受到強烈抵製,因為我們曾經像這樣生活了數百萬年。如果能實現真正的平等和對稱,我們會感到舒適。
這個假設並不容易達成。顯然,我與穀歌或是我與政府的關係天生就是不平等的。它們能夠獲取每個人的“生活流”,而我隻能獲得自己的,這意味著它們握有質量更高的資源。但是,如果能保留一些對稱性,讓我成為它們更高地位的一部分,承擔更多它們的責任,並能從它們提供的更好視角中獲益,或許事情是可行的。可以這樣說:警察當然會視頻監控公民。然而隻要公民也能視頻監控警察,並且能夠獲取警察的視頻,這種情況尚能接受。雖然問題並沒有最終解決,但是想要透明社會就必須開始行動。
那麽,該如何處理我們曾經稱之為隱私的狀態?在一個人們相互之間保持透明的社會,匿名有沒有存在的空間?
網絡讓如今比過去任何時候都更有可能真正實現匿名,但它同時使得在現實生活中真正實現匿名難上加難。我們在掩蓋身份的道路上每前進一步,就會在揭開身份使自己完全透明的道路上更進一步。我們既有來電顯示,也有來電隱藏,後來又有了來電過濾。接下來,生物特征監測(虹膜+指紋+聲音+麵部+心率)讓我們無處可藏。當一個人的任何信息都能被找到並存檔時,世界上就沒有隱私可言了。因此,不少聰明人渴望找到方便的匿名手段作為隱私的避難所。
然而,在我見過的任何係統中,當匿名變成常態時,係統必然失敗。充斥匿名者的社群要麽自行毀滅,要麽從完全匿名變成偽匿名狀態。比如,在ebay和reddit中,不斷產生的昵稱背後都有一個可以追蹤的身份。著名的非法團體anonymous由一群完全匿名的流動臨時誌願者組成。他們是一群沒有固定目標的義務警察。他們會讓某家信用卡公司癱瘓,或者搗毀伊斯蘭國好戰分子的推特賬戶。但是當他們不斷製造麻煩時,很難說他們對於社會的貢獻總體上是正麵的還是負麵的。
在一個文明社會中,匿名好比稀土金屬。大劑量的此類重金屬是已知的對生物體最致命的毒素。然而,這些元素卻是維持細胞生命的必需成分。但是,保持健康所需的量少到難以測量。匿名也是一樣的。難以察覺的少量匿名情況對係統來說是好的,甚至是必要的。匿名者讓偶爾的告密行為成為可能,並且能保護受迫害的邊緣人以及不被社會所容的人。但是當匿名大量出現時,將會危害係統。
匿名是一種逃避責任的手段。因此,推特、yikyak、redditt等網站上,大多數粗暴的騷擾都是匿名的。不用負責任的狀態最大程度上釋放出人類的惡。
一種流行的危險觀點認為,設計係統時應當支持方便的匿名手段,用來克服對隱私的窺探。這就如同提高人體內的重金屬含量,讓人變得更強壯。
隱私隻能通過信任獲得,而信任需要穩固的身份作基礎。結果是信任越多,責任越大,情況越好。就像微量元素一樣,匿名者永遠不應當被完全清除,但我們必須保持其數量盡可能接近於0。
數據領域的一切都趨向無限,至少是宇宙量級。在一個星球的數據量麵前,一比特的數據實在微不足道。我們根本無法實際測量一個星球的數據量。事實上,已經沒有合適的形容詞來表示這個新領域到底有多大。你的手機的容量是吉字節級別的。太字節是我們曾經無法想象的,而如今,我的桌上就有三樣容量達到太字節級別的東西。艾字節是目前地球的數量級。可能幾年後我們就會達到澤字節級別。堯字節是目前有官方測量的最大數量級科學術語,更大的數量級如今還是空白。直到今天,超過堯字節的數量級還是沒有被正式命名。但是,再過20年左右,我們將飛躍到堯字節級別。我提議,任何超過堯字節級別的東西都用“zillion”(無限多)來形容,這是一個涵蓋所有新數量級的靈活概念。
量變將引起質變。更高的數量級帶來差別。計算機科學家j.斯托斯·霍爾(j.storrs hall)寫道:“如果一種東西的數量足夠多,那麽它很可能表現出少量單一個體所不具備的屬性。根據我們的經驗,萬億級別的差距不可能隻是量的不同,一定還有質的區別。”一萬億倍的差距相當於一隻微不足道的塵蟎和一頭大象之間的差異,或是50美元和整個人類的經濟產出總量的差別,又或是一張名片的厚度和地球到月亮的距離之間的區別。
這種差別是“無限多級”的(zillionics)。
一萬億神經元提供的智慧是用一百萬神經元無法企及的;一個zillion數據點提供的洞察力用千百萬數據點是無法得到的;一個zillion芯片聯網創造的一個悸動、振顫的統一體用一千萬芯片是無法完成的;一個zillion超鏈接生成的信息和行為是用幾十萬鏈接無法想象的;社會網絡在“無限多級”的領域中運行著。人工智能、機器人以及虛擬現實技術都需要對“無限多級”的掌握。但是掌握“無限多級”需要的技術令人望而生畏。
在這個領域中,用來管理大數據的一般工具不太起作用。最大似然估計(mle)的統計預測方法無法起作用,因為在“無限多級”範圍內,估算最大的可能性是不太可能的。即時地操控“無限多級”量級的信息需要全新的數學領域、完全不同的軟件算法以及徹底創新型的硬件。這裏包含多少機會啊!
“無限多級”量級的新型數據編排方式需要一台全球規模的機器。這個機器的原子就是比特。就像原子構成分子一樣,比特可以構造複雜的結構。當複雜程度變高時,比特從數據升級成信息,進而成為知識。數據最強大的地方在於它們能夠以各種方式重組、重建、重用、重設、重混。比特想要互相關聯,一個比特單位的數據參與的關聯數越多,就越強大。
問題是,今天大部分的可用信息都是按照隻有人類能理解的方式編排的。手機裏的一張快照包含著一串50,000,000比特的信息,它們按照人眼能夠解讀的方式編排。你閱讀的這本書包含的700,00比特的信息按照英語語法規則編排。但是我們到達了極限。人類不可能觸碰,更別說處理“無限多級”數量的比特。為了發掘我們正在獲得或創造的“無限多級”字節級別數據的全部潛能,需要把比特按照機器和人工智能能夠理解的方式編排。當自我追蹤得到的數據能被機器知化時,它們將為我們提供全新、新奇、先進的了解自身的方式。幾年後,當人工智能可以理解電影時,我們就能用全新的方式賦予“無限多級”的視覺信息不同的目的。人工智能會像我們分析文章一樣分析圖像,因此,它們將像我們寫作時重組文字和短語那樣輕鬆地重組視覺元素。
基於“解綁”這個概念的新產業在過去20年裏逐漸湧現。技術創業公司能將旋律從歌曲中解綁,將歌曲從專輯中解綁,從而顛覆了音樂產業。革新性的itunes售賣單曲而不是專輯。從先前的混合形式中提取或萃取出來的音樂元素能夠重組成新的合成體,如可分享的播放列表。大型的綜合類報紙被解綁後,分成了分類信息表(craigslist)、股市行情(yahoo)、八卦新聞(buzzfeed)、餐館點評(yelp)以及各種自成一體並自行發展的故事。這些新元素能重新編排並重混成新的文本合成體,例如朋友用推特發布的快訊。下一步就是將分類信息、故事以及快訊再次解綁成更基本的成分,並用意想不到的方式重新編排。就如同把信息打碎成更小的粒子,讓它們互相之間產生新的“化學結合”。在未來20年中,最重要的工作就是將我們追蹤和創造的所有信息,包括商業、教育、娛樂、科學、體育以及社會關係,等等,放到它們最原始的級別去理解。這項任務規模極大,需要漫長的認知周期。數據科學家們將這個階段中的信息稱作“機器可讀”信息,因為參與“無限多級”級別工作的不是人類而是人工智能。當你聽見“大數據”這個詞時,指的就是這些內容。
包含不同“化學成分”的信息能夠產生數千種新的合成體以及新的信息“建築材料”。無休止的追蹤是必然的,但隻是一個開始。到了2020年,我們每年能製造540億個傳感器,它們散布在全球,嵌入我們的車裏,覆蓋在我們身體上,監視著我們的家以及公共街道。這張傳感器之網將在未來10年裏產生“無限多級”字節的數據,其中每一個比特又能創造出雙倍數量的元比特。經過實用人工智能的追蹤、解析和知化,這片浩瀚的信息“原子海洋”會被塑造出上百種新形態、新奇產品以及創新服務。更高層次的自我追蹤帶來的可能性會讓我們感到震驚。
[1] 雙盲測試,指將提示信息,如品牌、名稱等對測試者進行隱瞞,以免讓其預先產生偏見的測試,現廣泛應用於各種實驗和市場營銷中。——編者注
[2] 一個移動app,可以整合你的e-mail賬戶,並且將其中所有附件都整理在一起,讓你能夠在簡單的界麵上方便查找。——譯者注
[3] 是一家基於用戶地位置信息的手機服務網站,鼓勵手機用戶分享自己的所在位置。——編者注
[4] 一種智能計步器,可以記錄使用者的步伐,並且能夠計算出其在跑、坐、走等活動中消耗的能量。——編者注
[5] 一種電子郵件加密軟件,可以用來對郵件保密,以防止非授權者閱讀,並且能夠通過添加數字簽名等措施使收信人確認所收信件未被篡改。——編者注
透過數字技術的魔力,溫度計、心率監測儀、運動追蹤器、腦電波探測儀以及上百種其他的複雜醫療設備都能縮小到和書上的字,甚至標點一樣大。這些肉眼可見的測量設備能夠嵌入手表、衣服、眼鏡、電話,或者是房間、汽車、辦公室以及公共空間這些操作成本不高的地方。
2007年春天,我住在加州北部。一天,我和一位醫生朋友艾倫·格林(n greene)在屋後雜草叢生的小山上徒步旅行。我們一邊沿著泥濘的小路向山頂緩緩行進,一邊討論當時的一項新發明——塞進鞋帶中的微型計步器。它能記錄下每一步,然後將數據儲存到ipod中便於以後分析。我們可以利用這台微型設備計算出爬山消耗的卡路裏,或是追蹤我們一段時間內的鍛煉模式。
一周後,我和《連線》雜誌記者加裏·沃爾夫(gary wolf)又在同樣的地方徒步旅行。他對這些新興自我追蹤裝置的社會意義感到好奇。當時此類設備總共隻有十多種,但我們都預見到,當傳感器不斷變得更智能時,追蹤技術將大行其道。這是一種怎樣的文化趨勢?加裏指出,當我們依賴數字而不是文字時,將構建出一個“量化自我”。2007年6月,加裏和我在網上宣布,將召開一次“量化自我”見麵會,歡迎所有認為自己正在實踐這類行為的人參加。我們沒有給“量化自我”下具體定義,想看看會有哪些人出現。第一次活動中,超過20人來到了我在加州帕西菲卡市的工作室。
他們追蹤的項目種類之多讓我們大吃一驚。他們用可量化的單位測量自己的飲食、體質、睡眠模式、心情、血液因子、基因、地理位置,等等。有些人還自己製造設備。有人為了把力量、耐力、專注力和效率提升到極限,花了5年時間實行自我追蹤。如此進行自我追蹤是一般人難以想象的。今天,全世界有150個量化自我團體,超過30,000名成員。8年以來,每個月都有人在量化自我大會上展示一種之前看來幾乎不可能實現的巧妙新方法,追蹤生活的某個方麵。即便有人因為某種極端的個人習慣顯得格外突出,他的行為不久也會被看作是稀鬆平常的。
計算機科學家拉裏·斯馬爾rry smarr)追蹤了大約100項健康數據,包括他的皮膚溫度、皮膚電反應以及血液生化指標。每個月他都排列出自己糞便中微生物的組成,而這反映了他的腸道微生物係統組成情況。這個領域正迅速成為醫學界最有前景的前沿方向之一。有了這個數據流,再加上大量的業餘醫學調查資料,斯馬爾在沒有醫生提示症狀的情況下,診斷出自己患有克羅恩病(crohn’s disease),或潰瘍性結腸炎。外科手術證實了他的診斷。
斯蒂芬·沃爾夫勒姆是發明mathematica的天才。這是一款智能數學處理軟件(相對於文字處理軟件)。作為一個癡迷數字的人,沃爾夫勒姆將他的計算能力用在了1700萬份與自己生活有關的文件中。他處理了自己25年來收發的所有郵件,還記錄了13年來自己每一次的鍵盤敲擊、通話電話、腳步移動、在家中和辦公室裏的不同房間穿梭的軌跡以及出門後的gps位置。他追蹤了自己寫書和寫文章時修改校訂的次數。借助自己發明的mathematica軟件,他把自我追蹤變成了一種可以展示幾十年來自己日常生活模式的“個人分析”引擎。有些模式是難以察覺的,比如他在分析自身的數據之前並不知道自己在一天中什麽時候效率最高。
設計師尼古拉斯·費爾頓同樣在過去5年裏追蹤並分析自己所有的郵件、信息、臉譜網和推特上的帖子、通話以及旅行記錄。每年他都生成一份年度報告,將前一年的數據結果形象化。2013年,他總結道,自己平均每天有49%的時間是高效的,但星期三效率最高,達到了57%。他的獨處時間占總時間的43%,睡眠時間占總時間的三分之一(32%)。他使用這份定量綜述來幫助自己更好地記憶曾經見過麵的人的名字。
在量化自我會議上,我們看到有人追蹤自己的習慣性拖拉行為、喝咖啡的量、警覺程度以及打噴嚏的次數。老實說,任何可以追蹤的事物都有某個地方的人在進行追蹤。在最近的國際量化自我大會上,我提出了這個挑戰:讓我們想一個最不可能測量的事物,看看有沒有人在追蹤測量。於是我詢問500名自我追蹤者:“有人追蹤自己指甲的生長狀況嗎?”這看上去十分荒唐,但還是有一個人舉起了手。
更微縮的芯片、更強勁的電池以及雲端連接激勵了一些自我追蹤者嚐試時間跨度很長的追蹤,尤其在健康方麵。大多數人每年去醫院檢查一次身體的某些健康指標就不錯了。試想,如果看不見的傳感器每天都測量並記錄你的心率、血壓、溫度、血糖、血清、睡眠模式、體脂、活動水平、心情、心電圖、腦功能等,你會得到關於每項指標的上萬個數據點。你能掌握自己一年中各個時間段、各種狀況下的身體數據,包括放鬆或壓力大時、生病或健康時。幾年後,你就能精確地了解什麽是自己的常態,即指標水平在其中波動的狹小範圍。在醫療中,常態是一個假想的平均狀態。某人的常態並不適用於另一個人,反之亦然。平均的常態對具體某個人來說作用不大。然而,通過長期的自我追蹤,你會得到個人的基準水平,也就是你的常態,當你感覺不舒服或想用自己的身體做實驗時,這個常態會很有價值。
不久的將來,一個極其個人化的身體記錄數據庫(包括完整的基因序列)可以用來打造個人治療方案和個性化醫療。科學能夠通過你生活的日誌,為你專門生成治療方案。例如,家裏的一台智能的個性化製丸機能夠完全按照你當前的身體狀況把藥物進行混合。如果早上的治療減緩了症狀,係統還會調整晚上的劑量。
目前,標準的醫學研究方法就是在盡可能多的受試者身上做實驗。受試者數量(n)越多,研究效果將越好。當n等於100000的隨機人群時,我們才能根據實驗結論推測一個國家的狀況,因為此時受試人群中的離群個體對結果的影響在經過平均後能夠消除。事實上,由於經濟原因,大多數醫學實驗的參與者都不到500人。當然,科研中的n=500時,如果操作謹慎,就能通過藥物批準。
另一方麵,如果一項量化自我的實驗中的n隻有1,受試者就是你自己。你開始可能會覺得n=1的實驗在科學上是無效的,但是這對你個人來說是極其有效的。從多方麵看來,這是一個理想實驗,因為你所測試的變量x是特定對象,即你的身體和心智在某一時刻的即時狀況。誰會關心治療是否對他人有效呢?如果想了解治療是否對你有效,那麽一個n=1的實驗提供的結果完全適用。
n=1的實驗(是科學時代之前所有醫療的標準程序)真正的問題不在於它的結果沒什麽用處(其實是有用的),而在於它很容易誤導你自己。我們對於身體、食物、世界的運作(例如蒸發理論、振動理論和細菌理論)都有直覺和期望,而這些會讓我們忽視真正發生的事情。我們猜測瘧疾是空氣不好導致的,於是搬到更高的地方住,這確實帶來了些許改善。我們猜測麩質會導致臃腫,於是傾向於找到生活中支持這項猜測的證據而忽視那些認為麩質和臃腫無關的反麵證據。受到傷害或感到絕望時,人們尤其容易受偏見影響。n=1的實驗要想成功,必須將測試者的期望和受試者的期望分開,但由於一個人同時具有兩種身份,這是極其困難的。為了克服這種固有的偏見,人們發明了大量受試者參與的隨機雙盲測試 [1] 。由於受試者不知道他們的測試考察的是什麽,因此不可能帶有偏見。在自我追蹤的新時代中,我們用自動化裝置克服部分n=1的實驗中自我誤導的問題(在傳感器長時間的多次測量中,受試者會“忘記”測試這回事)。我們還能追蹤多個變量從而分散受試者的注意力,然後使用統計工具嚐試發掘出模式。
從許多針對大數量總體的傳統研究中我們了解到,治療起作用常常是因為我們相信它有作用。這又被稱作安慰劑效應。這些量化自我的追蹤並不完全拒絕安慰劑效應,它們反而與安慰劑效應共同起作用。如果幹預過程帶來了可測量的改善,那麽它就是有效的。我們關心的不是這種改善是否來自安慰劑效應,而是它能否對這個唯一的受試者起作用。因此,安慰劑效應可以是正麵的。
在正式研究中,你需要一個對照組來抵消對於正麵結果的偏見。在n=1的實驗中,量化自我實驗者,用自身的基準水平代替對照組。如果你追蹤自己的時間足夠長,指標足夠多,就能在實驗之外(或之前)建立你的表現模式,在對比時可以作為對照組有效地使用。
這些關於數字的討論都掩蓋了一個關於人類的事實:我們的數學直覺很差。人類的大腦不擅長統計。數學不是我們天生的語言。甚至在解讀非常形象化的圖表以及數值圖時我們也需要高度集中注意力。從長遠看,量化自我過程中的量化成分會變得不明顯。自我追蹤將遠遠超越數字化的範疇。
舉個例子,2004年,德國的信息技術經理烏多·瓦赫特(udowachter)把一個小數字羅盤的內芯取出來焊接到一條皮帶上。他繞皮帶一圈埋入了13條壓電振子,也就是讓智能手機振動的零件。最後,他入侵電子羅盤的係統,讓它不在圓形屏幕上顯示北的方向,而是讓連成一圈的皮帶的不同部位產生振動。皮帶上“對著”北方的部位會一直振動。當烏多係上皮帶後,他就能通過腰部感受北的方位。不到一周時間,他對北的方位感覺就準確無誤了。他不用思考就能指出北的方向,他是無意識的,但就是知道。幾周後,他的位置感得到了增強,就好像他能感覺到一座城市的地圖。數字追蹤產生的量化信息被結合到了全新的身體感覺之中。長遠看來,這是我們身體傳感器中許多數據流的最終歸宿,它們將不再是數字,而是新的身體感覺。
這些新的合成感覺不僅僅是娛樂性的。我們的自然感覺在數百萬年的演化過程中確保了我們可以在一個匱乏的世界生存。沒有足夠的能量、鹽或脂肪對我們是殘酷的威脅。馬爾薩斯和達爾文指出,每個生物種群都會擴張到將要發生饑荒的極限。今天,在技術帶來的富足世界中,生存的威脅來自過量的菁華物質。太多的菁華打破了我們新陳代謝和心理的平衡。而我們的身體還不太能留意到新的失衡狀況。演化過程中,我們不能夠感覺到血壓和血糖水平。但是技術能做到。比如,scanadu的scout這個新型自我追蹤設備,尺寸和瓶蓋一樣,隻要用它接觸你的前額,它就會一次性測量出你的血壓、變化的心率、心髒功能(心電圖)、氧水平、體溫和皮膚電傳導。不久它也將能測量你的血糖水平。最終你會把它穿戴在身上。這些信息不以數字形式而是以我們能感覺的方式反饋給我們,比如腰部的振動、臀部的擠壓。設備會讓我們獲得對於身體的新感覺,這是我們沒有演化出來但卻亟需的感覺。
自我追蹤的範疇遠遠大於健康。它涵蓋了我們的整個生活。微型可穿戴的數字“眼睛”和“耳朵”能夠記錄我們一天中每分每秒的所見所聞,從而幫助我們記憶。我們儲存的一連串電子郵件和信息構成了記錄自身想法的日誌。我們還可以記錄聽過的音樂、讀過的書和文章以及去過的地方。我們日常的走動和會麵,以及非常規的事件和經驗中的重要細節,也能被數據化,並匯集成基於時間順序的流動信息。
這種流動信息被稱作“生活流”(lifestream)。計算機科學家大衛·格勒恩特(david gelernter)於1999年首先描述了這個詞。他構想的“生活流”不光是一個數據檔案,還是一種新型的計算機界麵組織方式。基於時間順序的“流”將代替桌麵,而“流瀏覽器”將代替網頁瀏覽器。格勒恩特這樣定義“生活流”的架構: <blockquote>
“生活流”是按時間順序排列的文檔“流“,相當於你的電子化生活日記。你建立和收到的所有文檔都會被儲存在你的“生活流”中。“流”的底端是過去的信息(從你的電子出生證明開始)。遠離底端,也就是向現在的方向移動,“流”更多地包含最近的文檔,比如圖片、通信、賬單、電影、語音信息、軟件等。從現在向未來的方向移動,“流”包含著你將來需要的文檔:提醒、日曆項目、待辦事項。想象一下,有一本日誌會自動翻頁,能追蹤你生活中的每一個瞬間。你可以坐等新文檔的到來,它們會落在“流”的前端位置。向下移動指針瀏覽你的“流”,或點一下屏幕上的文檔,彈出的頁麵包含文檔的內容。你可以往回查看或看一看未來一周甚至十年應該做什麽。你的整個計算機網絡人生會呈現你的麵前。 </blockquote>
每個人都會生成自己的“生活流”。當我遇見你時,我們的“生活流”就在某個時刻發生了交集。如果我們預備下周見麵,交集將發生在未來;如果我們去年見過麵或出現在一張照片裏,那麽交集發生在過去。豐富的交織關係讓我們的“流”變得異常複雜,但是每個人的“流”都嚴格遵照時間順序,因而非常容易導航。我們會自然而然沿著時間線定位一個事件。比如“這發生在聖誕旅行之後,但在我的生日之前”。
關於“生活流”作為一種結構性隱喻的好處,格勒恩特說:“‘我把這條信息放在哪兒了’這個問題,總是隻有一個準確的答案——在我的‘流’中。與文檔層級相比,時間線、紀年表、日記、日報、剪貼簿這些概念在人類的文化和曆史中更加根深蒂固。”格勒恩特對一名sun公司的計算機代表說:“當我獲得一段新的記憶——比如,某個陽光明媚的下午與梅麗莎在‘紅鸚鵡’酒店外的一次交談——我不用命名這段記憶或是把它塞在某個目錄下。我可以使用記憶中的任何內容作為檢索的關鍵詞。我也不需要命名電子文檔,或把它們放進目錄。我隻要獲得他人的許可,就能把他人的‘流’混入我的‘流’中。反映我電子生活的個人‘流’可能混入包括我所屬團體或組織的其他‘流’。最終,我的‘流’中還將混入諸如報紙、雜誌等各種類型的‘流’。”
從1999年開始,格勒恩特多次嚐試開發其軟件的商業版本,但一直未能成功。一家購買了格勒恩特專利的公司曾起訴“蘋果”公司,認為“蘋果”盜用“生活流”的想法並用在自家的“時間機器”備份係統上(在“蘋果”的時間機器上,要想恢複一份文件,你隻要滾動時間線,回到需要的日期,就能得到包含當時計算機上所有內容的“快照”)。最近,格勒恩特和兒子丹尼爾再次嚐試開發一款運用“生活流”的商業化產品,叫做dittach [2] 。
事實上,我們已經在使用一款(至少部分包含)“生活流”產品,那就是臉譜網。你的臉譜網“流”是包括照片、新消息、鏈接、提醒以及生活中其他文件在內的流動信息。新的內容被不斷地添加到“流”的前端。如果願意,你可以在臉譜網中加入能捕捉你正在聽的音樂或正在播放的電影的小控件。臉譜網還提供了時間線界麵,方便你回顧過去。超過十億人的“流”能與你發生交集。朋友或陌生人在帖子上點“讚”或標記出照片中的一個人,兩股“流”就有了交叉。每天,臉譜網都在把更多時事或新聞“流”以及公司快訊加入“世界流”之中。
但這些隻是部分內容。“生活流”是一種主動且有意識的追蹤。當人們從相機中抓取照片、標記朋友或是刻意在“四方網” [3] (foursquare)上的某個地點簽到時,他們就在主動地管理自己的“流”。甚至他們的fitbit [4] 數據,包括步數計算,也都是主動的,因為這些數據存在的目的就是想獲得人們的關注。如果不進行某種程度上的關注,你就不能改變自己的行為。
無意識且不主動的追蹤同樣重要。這種被動的追蹤方式有時被稱作“生活記錄”(lifelogging),也就是簡單、機械、不動腦筋地完整記錄下一切,或者說不偏不倚地記錄生活中所有可記錄的事物。你將來可能會用到它時才去關注它。由於大部分內容永遠都用不上,“生活記錄”是一個包含巨大浪費的低效過程。今天,由於計算、存儲和傳感器設備十分廉價,這種浪費幾乎沒什麽代價。但是,對於計算的創造性“浪費”是許多最成功的數碼產品和公司的“秘方”。“生活記錄”的優勢同樣在於它對計算的奢侈使用。
最早進行“生活記錄”的人之一是20世紀80年代中期的泰德·尼爾森(ted nelson)(盡管他當時並沒有這個概念)。發明了術語“超文本”的尼爾森把自己與任何人在各地發生的對話用錄音帶或錄像帶記錄下來,這些對話的重要程度各不相同。因為和上千人見麵及交談,於是他租來一個大型集裝箱,裏麵塞滿了帶子。他的後繼者,90年代麻省理工學院(如今在多倫多大學)的斯蒂夫·曼(steve mann)用一個頭戴式攝像機記錄自己的日常生活。25年來,攝像機在他醒著的時候一直開著,記錄下一年到頭來每天發生的事情。他的裝置在一隻眼睛的上方包含一個微型屏幕,而鏡頭能從第一人稱視角進行記錄,預示著20多年後穀歌眼鏡(google ss)的誕生。由於相機遮住了他的半邊臉,周圍人會感到不自在,但他還是無意識地隨時記錄自己的整個生活。
當然,微軟研究院的戈登·貝爾(gordon bell)或許才是模範的“生活記錄”實踐者。從2000年開始的6年裏,貝爾在一項被他稱為mylifebits的大型實驗中,記錄下自己工作的方方麵麵。貝爾脖子上戴著一個特製的微型攝像機,它能注意到附近人的身體熱量,並且每60秒拍攝他們一次。貝爾的身體相機在檢測到光線發生變化時,也會拍下一張照片。貝爾記錄並儲存自己在電腦上的每次敲擊、每封郵件、每個訪問過的網站、電腦上的每個窗口以及它們打開的時間。他還記錄了自己的許多對話,過去說過的話與別人產生分歧時,可以“回滾”或倒帶查看。他還把收到的所有文件掃描成數字文檔,並在征得當事人同意的情況下把所有電話交流記錄下來。這項實驗的初衷,部分在於微軟想找出用來幫助員工管理生成的海量數據的某種“生活記錄”工具,因為解釋這些數據遠比僅僅記錄它們更有挑戰。
創建完整的回憶是“生活記錄”的重點。一份“生活記錄”記載了生活中的每件事,因此它能幫你恢複那些大腦可能忘記的事情。當生活被附上索引並完全儲存在“生活記錄”中時,你就能像使用穀歌那樣搜索你的生活。我們的生物記憶力十分不穩定,因此任何補償都有巨大作用。貝爾的實驗版完整回憶工具幫助他提高效率。它能從以前的對話中驗明真相或者重獲自己忘記的見解。在他的係統中,將生活轉換成數字化記錄不成問題,但是讀取有意義的數據需要更好的工具。
受到戈登·貝爾的影響,我在襯衫上夾著一個微型相機。這款narrative相機的大小約1平方英寸。隻要戴上相機,它每分鍾都會拍攝一張照片。如果輕觸兩下機身,它就會拍攝一次。照片在雲端進行處理,然後發回手機或存在網上。narrative的軟件能按一天中的生活場景智能分類圖片,並在一個場景中選擇最具代表性的三張照片,這樣大大減少了照片傳輸量。使用照片概覽,我可以先快速瀏覽一天內的2000多張照片,接著展開某個具體場景找到我想要的某個瞬間。我可以在1分鍾內輕鬆地瀏覽一天的“生活流”。
雖然照片的分辨率夠高,效果也很自然,但是因為沒有構圖(鏡頭隨衣服移動),並且是“隨機”拍攝,因此不適合分享。人們可能沒被拍到頭部,或是在眨眼睛,又或者被一張隨機的房間圖擠掉,更別說拍出文藝範了。這種“生活記錄”類的照片作為詳盡的視覺日誌,一個月中隻要產生幾張有價值的照片就足夠了。
narrative公司發現,典型的用戶在參加會議、度假或是想記錄一段經曆時會使用他們的產品,其中重現會議場景的效果最理想。持續拍攝的相機能夠捕捉很多初次見麵的人,而多年後你隻要瀏覽一下自己的“生活流”,很容易就能想起他們以及他們說過的話,比名片更好用。“生活流”照片能有效地提示我們有關度假的回憶以及家庭生活中的大事。例如,我最近就在外甥的婚禮上使用了narrative相機。我的記錄不僅包括了人人分享的標誌性時刻,還有與陌生人之間的對話。這一代narrative相機不能保存聲音,但是下一代產品將包含錄音功能。貝爾在研究中發現,信息量最大的媒體是有照片作為提示和索引的音頻信息。
使用拓展版的“生活記錄”有這四條好處:
·它能365天、一周7天、每天24小時地全時段監控身體測量數據。想象一下,如果我們持續地對血糖水平進行實時監控,公共醫療會發生怎樣的變化?如果你能實時監控是否有生化物質或毒素從周圍環境進入血液中,你的行為將發生怎樣的變化?(你或許會說:“我再也不想回到這裏!”)這些數據既可以作為預警係統,也可以作為診斷疾病或用藥的依據。
·它能提供包括你遇見的人、和他人的對話、去過的地方、參與過的事件在內的互動記憶。你可以搜索、獲取或是分享這些記憶。
·它能提供包括所有你生產的東西、寫下的文字或說過的話在內的完整存檔。深層次的分析能夠幫助你提升效率和創造力。
·它能提供一種組織、構造以及解讀你自身生活的方式。
隻要分享“生活記錄”,我們就能利用信息檔案協助他人工作以及擴大人脈。在生物領域,分享醫療日誌能迅速加快醫療發現的進程。
許多懷疑者認為,兩大挑戰讓“生活記錄”注定隻能在小範圍內流行。
首先,目前的社會壓力讓自我追蹤看上去是件十分怪異的事。擁有穀歌眼鏡的人不喜歡自己戴眼鏡的樣子,並且和朋友在一起時用眼鏡進行記錄,甚至解釋自己為什麽不記錄都讓他們感到不適,於是很快把眼鏡丟在一邊。就像加裏·沃爾夫所說:“在日記本上寫日記值得欽佩,但在電子表格上寫日記讓人起雞皮疙瘩。”但我相信,我們很快會發明新的社會規範和技術革新來確定“生活記錄”在哪些情況下是合適的。20世紀90年代,當最早的一批人開始使用手提電話時,刺耳的電話鈴聲著實可怕。在火車上、浴室中或電影院裏,手提電話發出高分貝的刺耳聲響;通話時,人們扯著嗓子,說話聲與鈴聲一樣大。如果當時的人設想人人擁有手機的未來生活,腦中隻會浮現一個永不消停的喧鬧世界。如今我去看電影時,即便周圍人都有手機,也不會聽到鈴聲,甚至看不見發光的屏幕,因為這些事情被認為是不合適的。我們會發展出類似的社會習俗以及技術解決方案,讓人們接受“生活記錄”。
其次,當每個人每年產生的數據量達到拍字節或艾字節,而“生活記錄”如何發揮作用呢?沒人能遍覽這海量的數據,你將毫無頭緒地淹沒在數據的海洋中。如今的軟件大致都存在這個問題。解釋數據是一項極其耗時的工作,你必須精通計算,技術熟練並且充滿動力才能從數據長流中萃取有意義的信息。所以,自我追蹤仍是小眾的活動。然而,廉價的人工智能將能克服大部分問題。研究實驗室中的人工智能已經能夠篩選億萬條記錄,讓有意義的重要模式顯現出來。舉個例子,隻要價格便宜,穀歌用來描述一張隨機照片內容的人工智能技術可以被拿來解讀我襯衫上的narrative相機裏的照片。我隻要用最簡單的語言詢問narrative相機,它就能尋找多年前我參加的聚會上某個戴著海盜帽的家夥,如果確有其人,那麽我們倆的“流”也將發生聯係。或者我還可以詢問自己待在哪些房間時心跳會加快,影響因素是房間的顏色、室內的溫度還是天花板高度?這些現在看起來有些奇特的要求在10年後,將會是很平常的機械命令,就像如今司空見慣的穀歌搜索在20年前看來很神奇。
然而,這些還不夠全麵。我們作為網絡中的人,會進行自我追蹤,並且大多數人都會追蹤自己的生活。但是網絡上除了人,還有更多的事物,數以億計的事物也會追蹤自己。幾十年後,任何被生產出來的東西都將包含一塊能聯網的芯片。廣泛聯網帶來的一個結果就是,我們可以精確地追蹤一樣東西是如何被使用的。例如,從2006年開始,每輛出廠轎車都在儀表盤下裝有一塊omb芯片,用來記錄車的使用情況。它會追蹤汽車的行駛裏程、車速、急刹次數、過彎速度以及油耗。最初設計這些數據是用來協助車輛的維修。如果你願意提供omb駕駛記錄,一些保險商,如progressive公司會降低你的汽車保險費用。駕駛方式越安全的人支付的費用越低。汽車的gps定位也能被準確追蹤,因此駕駛員在哪些道路上行駛以及行駛的頻率可以成為征稅的依據。我們可以把這種道路使用費看作虛擬收費站或是自動征稅。
物聯網的設計是用來追蹤數據,這也是它所處的雲端的本質屬性。在未來5年中,我們預計雲端中加入的340億聯網設備將會用來傳輸數據。雲端的作用則是保存數據。任何接觸雲端的東西都能被追蹤,也一定會被追蹤。
最近,在研究員卡米爾·哈特塞爾(camille hartsell)的幫助下,我整理搜集了美國所有對我們進行常規追蹤的設備和係統的清單。這裏的關鍵詞是“常規”。我排除了那些黑客、罪犯或網絡部隊使用的非常規的追蹤手段。我還略過了美國政府部門想要追蹤某些特定目標時運用的手段(政府的追蹤能力和他們的預算成正比)。這張清單包含了一個普通人在平常的生活中可能遇到的追蹤手段。每個例子都有官方來源,或是出現在主流出版物上。
汽車活動——從2006年開始,每輛車都包含一塊芯片。當你發動汽車時,它就開始記錄車速、刹車、過彎、裏程、事故等狀況。
高速公路交通——高速公路上的柱子和測速器上安裝的攝像頭通過車牌和快速追蹤標誌記錄汽車的位置。每月有7000萬個車牌被記錄。
拚車軟件——優步、lyft和其他零散的打車軟件記錄你的旅程。
長途旅行——你的航空和鐵路行程被記錄。
無人偵察機——“捕食者”無人偵察機監控美國邊境的活動。
郵政信件——你寄出或收到的每封信的表麵信息都被掃描並數字化了。
公用設施——你的用水和用電模式都被公共設備記錄了(目前沒有垃圾分類信息)。
手機位置和通話記錄——你通話的時間、地點和對象(元數據)會被儲存數月。有些手機供應商通常會把信息和電話的內容儲存幾天到幾年不等。
民用攝像頭——在大多數美國城市的中心地帶,攝像頭24小時不間斷地記錄你的活動。
商業和私人空間——如今,68%的公立機構主管、59%的私人企業主、98%的銀行工作人員、64%的公立學校人員以及16%的業主在攝像頭下生活或工作。
智能家居——智能恒溫調節器(如nest)檢測你是否在家,同時記錄你的行為模式,並將這些數據傳輸到雲端。智能插座(如belkin)監控你的用電量和用電時間並把數據分享到雲端。
家居監控——視頻攝像頭記錄你在家裏或四周的活動,將數據儲存在雲端服務器。
互動設備——你傳達給手機(siri,now,contana)、主機(kinect)或環境話筒(亞馬遜echo)的語音命令和信息在雲端被記錄和處理。
商場會員卡——超市能追蹤你購買的物品。
電子零售商——亞馬遜之類的零售商不僅追蹤你購買的東西,還有你瀏覽或想買的東西。
美國國家稅務局(irs)——國稅局追蹤你一生的財務狀況。
信用卡——顯然,所有的購買行為都被追蹤了。信用卡和複雜的人工智能相結合形成模式,揭示你的人格、種族、癖好、政治觀點和愛好。
電子錢包和電子銀行——諸如mint一類的信息采集組織追蹤你的貸款、房貸以及投資等完整的財務狀況。類似square和paypal這樣的錢包軟件追蹤你的購買情況。
人臉識別——臉譜網能在他人上傳的照片中辨認(標記)你的頭像。照片的拍攝地點代表了你過去所處的位置。
網絡活動——網頁廣告cookie追蹤你上網時的舉動。上千家頂尖網站中有80%利用網頁cookies追蹤你在網上的行蹤。通過與廣告網絡(aworks)的合約,你沒有訪問過的網站也能得到你的瀏覽曆史。
社交媒體——它們能辨認你的家庭成員、朋友以及朋友的朋友,還能追蹤你以前的老板以及現在同事,也能了解你如何度過閑暇時間。
搜索瀏覽器——穀歌默認永久記錄你查詢過的所有問題。
流媒體服務——他們能追蹤你看過哪些電影flix)、音樂(spotify)、視頻(youtube)以及你的評論時間和內容。有線電視公司會記錄你的觀看曆史。
讀書——公共圖書館會保存你的借書記錄一個月。亞馬遜永久儲存你的購買曆史。kindle監控你的電子書閱讀模式,包括你的閱讀進度、閱讀每頁的耗時以及停止閱讀的位置。
健康追蹤——你進行身體活動的時間、地點通常會被24小時不間斷記錄,其中還包括每天睡覺和起床的時間。
很容易設想,能夠整合所有這些“流”的機構將擁有多麽巨大的權力。因為聚集這些內容在技術上十分便利,人們會害怕“老大哥”的到來。當然,目前大多數“流”都是獨立的,數據並沒有被整合或關聯。其中,幾類數據可能被捆綁在一起(比如信用卡和媒體的使用),但總體看來,不存在類似“老大哥”的大規模整合“流”。政府行動緩慢,因此其作為遠遠落後於技術上能達到的程度(他們自身的安全措施落後幾十年)。還有隱私法案這道來之不易的“薄牆”,阻止了美國政府整合這些“流”的行動。然而,企業整合數據的行為幾乎不受法律製約,因此許多公司成了政府的數據收集代理方。客戶的數據是商場中的新財富,因此可以肯定:公司(和間接意義上的政府)將收集更多數據。
根據菲利普·k·迪克的短篇小說改編的電影《少數派報告》,描述了一個不太遙遠的未來社會,其中監控係統能在罪犯作案前將他們抓獲。迪克稱這種幹預為“預防犯罪”偵查。我曾經認為迪克“預防犯罪”的概念是不現實的,現在我不這麽想了。
根據上麵的常規追蹤清單,我們不難推斷未來50年的情況。所有先前無法測量的東西都被量化、數字化,並且可以被追蹤。我們會持續追蹤自己,我們和朋友之間也會互相追蹤。企業和政府會對我們實行更多追蹤。50年後,無處不在的追蹤行為將成為常規。
我在先前的章節“使用”中提到,互聯網是世界上最大、最快的“複印機”,任何接觸到互聯網的事物都會被複製。互聯網想要生產更多複製品。起初,這個事實讓原創個人和公司深感麻煩,因為他們的作品通常會被不加區分地免費複製,而有些東西原本是珍稀的。有人(最容易想到電影工作室和唱片品牌)反抗這種偏好,而另一些人選擇順應這種偏好。擁抱互聯網對複製的偏好,並尋求難以被複製的價值(例如,通過個性化、實體化、權威性獲得價值)的人會獲得成功,而否認、禁止以及試圖貶低複製渴望的人則落後了,將來需要試圖趕上。消費者當然喜歡各種混雜的複製品,同時還通過為互聯網提供內容獲得好處。
對複製的偏好不僅受文化和社會影響,還是由技術決定的。這種偏好在命令經濟中,在不同的社會背景下,甚至在另一個星球上也是成立的。既然我們無法停止複製,那麽圍繞無處不在的複製的法律和社會體製十分重要。我們如何處理創新、知識產權和責任、對複製品的擁有權和獲取將會極大地影響社會的繁榮和幸福。無處不在的複製是必然的,但是我們可以對其具有的特征做出重要決定。
追蹤也遵循類似的必然變化。把上文中的“複製”換成“追蹤”就能把兩者進行對比:
互聯網是世界上最大、最快的追蹤機器,任何接觸到互聯網的事物都可以,且都會被追蹤。互聯網想要追蹤所有事物。我們將不斷地追蹤自己,追蹤朋友以及被朋友、公司和政府追蹤。追蹤曾經是不常見的昂貴行為,因此給公民帶來深深的困擾,並且一定程度上來說對公司同樣如此。一些人全力對抗對於追蹤的偏好,另一些人最終會順應這種偏好。我相信試圖將其規範化、民用化,以及讓它更有效的人將會獲得成功,而試圖禁止它,利用法律排斥它的人將會落後。消費者說,自己不願意被追蹤,但他們其實不斷提供數據給這台機器,因為他們想從中獲得好處。
對追蹤的偏好不僅受文化和社會影響,還是由技術決定的。這種偏好在命令經濟中,在不同的社會背景下,甚至在另一個星球上也是成立的。既然無法停止追蹤,那麽圍繞無處不在的追蹤的法律和社會體製十分重要。無處不在的追蹤是必然的,但是我們可以對其具有的特征做出重要決定。
這個星球上增長最快的就是我們生產的信息量。幾十年間,信息的膨脹速度比其他任何事物都要快。信息的積累速度比混凝土用量的增長速度(7%的年增長率)更快,比智能手機或芯片出口的增長速度更快,比汙染或二氧化碳這類副產品的產生速度更快。
加州大學伯克利分校的兩位經濟學家統計了全球信息生產量,計算出新信息正以每年66%速率增長。雖然這算不上天文數字,甚至趕不上ipods 2005年600%的增長量。但是這種激增是短暫的,不會維持數十年(ipod在2009年停產)。另一方麵,信息的增長已經持續了至少一個世紀。66%的年增長速度相當於每18個月翻一番,正符合摩爾定律規定的速率。到5年前為止,人類儲存了數百艾字節的信息,相當於地球上的每個人擁有80座亞曆山大圖書館。而今天的信息量相當於每人擁有320座圖書館。
用信息爆炸來描述這種增長是另一種將其形象化的方式。全世界每秒鍾生產6000平方米的信息存儲材料,包括光盤、芯片、dvd、紙張、膠片,我們會將數據填在其中。6000平方米每秒的速率大致相當於原子彈爆炸產生的衝擊波傳播的速度。信息以類似核爆的方式膨脹。但與真正的原子彈爆炸不同,信息爆炸不會隻持續數秒,而會一直進行下去,好比一場持續幾十年的核爆。
然而,我們日常生活中產生的大部分信息都沒有被捕捉或記錄。盡管追蹤和存儲量呈爆炸性增長,日常生活的主要內容並沒有被數字化。這些沒有被計算在內的信息是“未開發”或是在“暗處”的信息。開發這些信息將確保我們的信息總量在未來幾十年內不斷翻倍。
我們會生產關於信息的信息,這導致了每年收集到的信息量不斷增加。這類關於信息的信息被稱為元信息(meta-information)。我們捕捉到的所有數字信息都將促進我們生產與其相關的信息。當我們手臂上的運動手環捕捉到我們行走了一步,就會立即添加一個時間標記數據,接著它會生產更多新信息把這個數據和其他步數信息聯係在一起,而當這些時間標記數據被繪製成圖表時,又生成了大量新數據。與此類似,當一個年輕女孩在直播視頻中彈奏電吉他時,以捕捉到的音樂數據為基礎,產生了關於這個視頻片段的索引數據,點“讚”的數據信息以及與朋友分享後包含的複雜信息包。捕捉的數據越多,我們基於數據生產的數據就越多。這類元數據的增長速度甚至超過基礎信息,並且它的規模幾乎是無限的。
元數據是一種新的財富,因為比特與其他比特發生關聯時,價值就會提升。比特最低效的呈現方式就是單獨且直接地存在。沒有被複製、分享或是與其他比特相關聯的比特將是短命的。比特最糟糕的未來就是待在某個黑暗、與世隔絕的墓穴之中。它們真正想要的是與其他比特一起出去逛逛、被廣泛複製、成為元比特或是一條連續代碼中的行動比特。我們可以用擬人的方法這樣描述:
比特想要移動。
比特想要與其他比特發生關聯。
比特想要被實時測算出來。
比特想要被重複、複製和複印。
比特想要成為元比特。
當然這是純粹的擬人手法,因為比特是沒有意誌的,但它們有傾向。與其他比特關聯的比特將傾向於被更多地複製。就像自私的基因傾向於自我複製,比特也是如此。同理,就像基因“想要”能夠幫助它們自我複製的身體編碼,自私的比特也“想要”幫助他們複製和傳播的係統。比特的行為方式讓它們看上去想要自我複製、移動以及被分享。如果你想依靠比特完成任何事,最好明白這一點。
因為比特想要被重複、複製以及被鏈接,信息爆炸和科幻小說級別的追蹤將不會停止。人類想要得到的很多好處來自於數據流之中。目前最主要的問題是:我們想要選擇哪種全麵追蹤的方式?“他們”了解我們,而我們對“他們”一無所知,我們想要這種單向的環形監獄式的追蹤嗎?或者我們可以建立一個互動、透明的“互相監督”機製,其中包含對監督者的監督?第一個選擇是地獄,第二個則容易駕馭。
從前的小鎮就是標準的情形。街對麵的女士會追蹤你的一舉一動。她透過窗戶瞥一眼,就知道你什麽時候去看病,什麽時候買了一台新電視以及誰周末和誰待在一起。同樣,你也透過窗戶看她,知道她周四晚上幹什麽,在街角的藥店把什麽東西放進籃子裏。互相監督對雙方都有好處。如果她不認識的人趁你不在時進入你家,她就會報警。當天她不在家時,你會幫她查收郵箱中的信件。小鎮上的互相監督是對稱的,所以有效。你知道誰在看你,知道他們如何使用你的信息。信息是否準確,使用是否得體,你都可以向他們問責。受監督時,你也可以從中得利。最終,人們的處境是一致的。
今天我們被追蹤時會感到不適,是因為我們不清楚誰在監督我們,以及他們知道多少信息。我們無法決定他們如何運用我們的信息。信息需要糾正時,我們無法向他們問責。他們記錄我們時,我們無法記錄他們。並且被監督能得到哪些好處並不明朗。彼此的關係是不平衡、不對稱的。
無處不在的監督是必然的。因為我們無法讓這個機製停止追蹤,我們隻能讓人們之間的關係更對稱。實現文明的互相監督需要技術的修補和新的社會準則。科幻小說家大衛·布林(david brin)用他的書名《透明社會》(transparent society)形容這樣的世界。這種設想如何運作呢?考慮一下我在“分享”那一章中描述的去中心化的開源通貨——比特幣。比特幣將經濟體中的每一筆交易公開記錄在一本公共賬目上,使得所有的金融交易公開透明。交易的有效性由用戶之間的相互監督而不是中央銀行的監督實現。還有一個例子,一種開放式的加密軟件pgp [5] 基於任何人都能查看的代碼,包括一個公鑰,因此人人都可以信任並驗證。這些創新發明沒有補救現存的信息不對稱的問題,卻展示了由相互警惕的機製驅動的體係如何運行。
互相監督的社會中會出現一種權利意識,即每個人都有權獲取關於自己的數據,並從中受益。但是每種權利都伴隨著義務,因此每個人都有義務尊重信息的完整,負責任地分享信息並接受他人監督。
用法律限製追蹤的擴張或許就像用法律禁止複製一樣無效。我是泄露上萬份美國國家安全局機密文件的檢舉人愛德華·斯諾登的粉絲,因為我認為包括美國政府在內的許多政府最大的過失就是隱瞞它們實行追蹤的事實。強大的政府在追蹤我們,並且這種追蹤完全不對稱。我為斯諾登的檢舉叫好不是因為它會減少追蹤行為,而是因為它能增加透明度。如果我們能讓追蹤重新變得對稱,可以追蹤那些追蹤我們的人;如果我們能讓追蹤者負法律責任(應當出台相關法規),並且為信息的準確性負責;如果我們能讓利益更明顯且與我們更相關,那麽我想追蹤的擴張將是可以接受的。
我希望朋友把自己當個體看待,為了建立這樣一種關係,我必須保持開放和透明,並和他們分享我的生活。我也希望公司將我當個體看待,因此我必須保持開放、透明並與它們分享信息。我還希望政府把我當個體看待,因此我必須向它們公開個人信息。個人化和透明度之間有一種對應關係,個人化程度越高所需的透明度就越高。絕對的個人化(虛榮)需要絕對的透明度(無隱私)。如果寧願保持隱私,不對朋友和機構開放自己,那麽我必須接受個性不受重視的一般化對待。我將成為一個平均數。
現在,想象一下這些選項被固定在一根滑動軌道的兩端,左端是個性化和透明,右端是隱私和一般化。滑塊可以向兩邊或中間的任何位置滑動,而這個位置代表我們重要的選擇權。讓人人都感到意外的是,當技術讓我們進行選擇(保有選擇權十分重要)時,人們傾向於將滑塊推向個性化和透明的那端。心理學家在20年前不可能預料到這一點。如果今天的社會媒體教會我們一些關於人類的東西,那就是人類分享的衝動勝過保持隱私的願望。這讓專家們感到驚訝。至今為止,當麵臨選擇的時候,我們一般傾向於更多地分享、揭露以及變得更加透明。我會這樣總結:虛榮戰勝了隱私。
人類曾經世世代代生活在部落或宗族之中,那時我們所有的行動都是公開、可見的,沒有秘密可言。我們的心智在持續的互相監督下演化。從演化角度來說,互相監督是我們的本性狀態。我認為,與諸多現代懷疑態度相反,人與人之間形成循環監督的世界不會受到強烈抵製,因為我們曾經像這樣生活了數百萬年。如果能實現真正的平等和對稱,我們會感到舒適。
這個假設並不容易達成。顯然,我與穀歌或是我與政府的關係天生就是不平等的。它們能夠獲取每個人的“生活流”,而我隻能獲得自己的,這意味著它們握有質量更高的資源。但是,如果能保留一些對稱性,讓我成為它們更高地位的一部分,承擔更多它們的責任,並能從它們提供的更好視角中獲益,或許事情是可行的。可以這樣說:警察當然會視頻監控公民。然而隻要公民也能視頻監控警察,並且能夠獲取警察的視頻,這種情況尚能接受。雖然問題並沒有最終解決,但是想要透明社會就必須開始行動。
那麽,該如何處理我們曾經稱之為隱私的狀態?在一個人們相互之間保持透明的社會,匿名有沒有存在的空間?
網絡讓如今比過去任何時候都更有可能真正實現匿名,但它同時使得在現實生活中真正實現匿名難上加難。我們在掩蓋身份的道路上每前進一步,就會在揭開身份使自己完全透明的道路上更進一步。我們既有來電顯示,也有來電隱藏,後來又有了來電過濾。接下來,生物特征監測(虹膜+指紋+聲音+麵部+心率)讓我們無處可藏。當一個人的任何信息都能被找到並存檔時,世界上就沒有隱私可言了。因此,不少聰明人渴望找到方便的匿名手段作為隱私的避難所。
然而,在我見過的任何係統中,當匿名變成常態時,係統必然失敗。充斥匿名者的社群要麽自行毀滅,要麽從完全匿名變成偽匿名狀態。比如,在ebay和reddit中,不斷產生的昵稱背後都有一個可以追蹤的身份。著名的非法團體anonymous由一群完全匿名的流動臨時誌願者組成。他們是一群沒有固定目標的義務警察。他們會讓某家信用卡公司癱瘓,或者搗毀伊斯蘭國好戰分子的推特賬戶。但是當他們不斷製造麻煩時,很難說他們對於社會的貢獻總體上是正麵的還是負麵的。
在一個文明社會中,匿名好比稀土金屬。大劑量的此類重金屬是已知的對生物體最致命的毒素。然而,這些元素卻是維持細胞生命的必需成分。但是,保持健康所需的量少到難以測量。匿名也是一樣的。難以察覺的少量匿名情況對係統來說是好的,甚至是必要的。匿名者讓偶爾的告密行為成為可能,並且能保護受迫害的邊緣人以及不被社會所容的人。但是當匿名大量出現時,將會危害係統。
匿名是一種逃避責任的手段。因此,推特、yikyak、redditt等網站上,大多數粗暴的騷擾都是匿名的。不用負責任的狀態最大程度上釋放出人類的惡。
一種流行的危險觀點認為,設計係統時應當支持方便的匿名手段,用來克服對隱私的窺探。這就如同提高人體內的重金屬含量,讓人變得更強壯。
隱私隻能通過信任獲得,而信任需要穩固的身份作基礎。結果是信任越多,責任越大,情況越好。就像微量元素一樣,匿名者永遠不應當被完全清除,但我們必須保持其數量盡可能接近於0。
數據領域的一切都趨向無限,至少是宇宙量級。在一個星球的數據量麵前,一比特的數據實在微不足道。我們根本無法實際測量一個星球的數據量。事實上,已經沒有合適的形容詞來表示這個新領域到底有多大。你的手機的容量是吉字節級別的。太字節是我們曾經無法想象的,而如今,我的桌上就有三樣容量達到太字節級別的東西。艾字節是目前地球的數量級。可能幾年後我們就會達到澤字節級別。堯字節是目前有官方測量的最大數量級科學術語,更大的數量級如今還是空白。直到今天,超過堯字節的數量級還是沒有被正式命名。但是,再過20年左右,我們將飛躍到堯字節級別。我提議,任何超過堯字節級別的東西都用“zillion”(無限多)來形容,這是一個涵蓋所有新數量級的靈活概念。
量變將引起質變。更高的數量級帶來差別。計算機科學家j.斯托斯·霍爾(j.storrs hall)寫道:“如果一種東西的數量足夠多,那麽它很可能表現出少量單一個體所不具備的屬性。根據我們的經驗,萬億級別的差距不可能隻是量的不同,一定還有質的區別。”一萬億倍的差距相當於一隻微不足道的塵蟎和一頭大象之間的差異,或是50美元和整個人類的經濟產出總量的差別,又或是一張名片的厚度和地球到月亮的距離之間的區別。
這種差別是“無限多級”的(zillionics)。
一萬億神經元提供的智慧是用一百萬神經元無法企及的;一個zillion數據點提供的洞察力用千百萬數據點是無法得到的;一個zillion芯片聯網創造的一個悸動、振顫的統一體用一千萬芯片是無法完成的;一個zillion超鏈接生成的信息和行為是用幾十萬鏈接無法想象的;社會網絡在“無限多級”的領域中運行著。人工智能、機器人以及虛擬現實技術都需要對“無限多級”的掌握。但是掌握“無限多級”需要的技術令人望而生畏。
在這個領域中,用來管理大數據的一般工具不太起作用。最大似然估計(mle)的統計預測方法無法起作用,因為在“無限多級”範圍內,估算最大的可能性是不太可能的。即時地操控“無限多級”量級的信息需要全新的數學領域、完全不同的軟件算法以及徹底創新型的硬件。這裏包含多少機會啊!
“無限多級”量級的新型數據編排方式需要一台全球規模的機器。這個機器的原子就是比特。就像原子構成分子一樣,比特可以構造複雜的結構。當複雜程度變高時,比特從數據升級成信息,進而成為知識。數據最強大的地方在於它們能夠以各種方式重組、重建、重用、重設、重混。比特想要互相關聯,一個比特單位的數據參與的關聯數越多,就越強大。
問題是,今天大部分的可用信息都是按照隻有人類能理解的方式編排的。手機裏的一張快照包含著一串50,000,000比特的信息,它們按照人眼能夠解讀的方式編排。你閱讀的這本書包含的700,00比特的信息按照英語語法規則編排。但是我們到達了極限。人類不可能觸碰,更別說處理“無限多級”數量的比特。為了發掘我們正在獲得或創造的“無限多級”字節級別數據的全部潛能,需要把比特按照機器和人工智能能夠理解的方式編排。當自我追蹤得到的數據能被機器知化時,它們將為我們提供全新、新奇、先進的了解自身的方式。幾年後,當人工智能可以理解電影時,我們就能用全新的方式賦予“無限多級”的視覺信息不同的目的。人工智能會像我們分析文章一樣分析圖像,因此,它們將像我們寫作時重組文字和短語那樣輕鬆地重組視覺元素。
基於“解綁”這個概念的新產業在過去20年裏逐漸湧現。技術創業公司能將旋律從歌曲中解綁,將歌曲從專輯中解綁,從而顛覆了音樂產業。革新性的itunes售賣單曲而不是專輯。從先前的混合形式中提取或萃取出來的音樂元素能夠重組成新的合成體,如可分享的播放列表。大型的綜合類報紙被解綁後,分成了分類信息表(craigslist)、股市行情(yahoo)、八卦新聞(buzzfeed)、餐館點評(yelp)以及各種自成一體並自行發展的故事。這些新元素能重新編排並重混成新的文本合成體,例如朋友用推特發布的快訊。下一步就是將分類信息、故事以及快訊再次解綁成更基本的成分,並用意想不到的方式重新編排。就如同把信息打碎成更小的粒子,讓它們互相之間產生新的“化學結合”。在未來20年中,最重要的工作就是將我們追蹤和創造的所有信息,包括商業、教育、娛樂、科學、體育以及社會關係,等等,放到它們最原始的級別去理解。這項任務規模極大,需要漫長的認知周期。數據科學家們將這個階段中的信息稱作“機器可讀”信息,因為參與“無限多級”級別工作的不是人類而是人工智能。當你聽見“大數據”這個詞時,指的就是這些內容。
包含不同“化學成分”的信息能夠產生數千種新的合成體以及新的信息“建築材料”。無休止的追蹤是必然的,但隻是一個開始。到了2020年,我們每年能製造540億個傳感器,它們散布在全球,嵌入我們的車裏,覆蓋在我們身體上,監視著我們的家以及公共街道。這張傳感器之網將在未來10年裏產生“無限多級”字節的數據,其中每一個比特又能創造出雙倍數量的元比特。經過實用人工智能的追蹤、解析和知化,這片浩瀚的信息“原子海洋”會被塑造出上百種新形態、新奇產品以及創新服務。更高層次的自我追蹤帶來的可能性會讓我們感到震驚。
[1] 雙盲測試,指將提示信息,如品牌、名稱等對測試者進行隱瞞,以免讓其預先產生偏見的測試,現廣泛應用於各種實驗和市場營銷中。——編者注
[2] 一個移動app,可以整合你的e-mail賬戶,並且將其中所有附件都整理在一起,讓你能夠在簡單的界麵上方便查找。——譯者注
[3] 是一家基於用戶地位置信息的手機服務網站,鼓勵手機用戶分享自己的所在位置。——編者注
[4] 一種智能計步器,可以記錄使用者的步伐,並且能夠計算出其在跑、坐、走等活動中消耗的能量。——編者注
[5] 一種電子郵件加密軟件,可以用來對郵件保密,以防止非授權者閱讀,並且能夠通過添加數字簽名等措施使收信人確認所收信件未被篡改。——編者注