拉裏·佩奇、謝爾蓋·布林與搜索
創新者:一群技術狂人和鬼才程序員如何改變世界 作者:沃爾特·艾薩克森 投票推薦 加入書簽 留言反饋
1994年1月,也就是賈斯汀·霍爾剛剛開設那個令人費解的個人主頁的時候,世界上總共隻有700個網站。這個數字在同年年底變成了1萬,在次年年底更是增長至10萬。個人電腦和網絡的結合帶來了一個奇跡:任何人都可以在任何地方獲取內容,同時將自己的內容分享到世界各地。但是如果要利用好這個正在迅速膨脹的宇宙,我們需要找到一個簡單的方法來幫助人們找到所需的東西——一個將人、計算機和網絡三者連接起來的簡單接口。
最早嚐試做到這點的是一些人工編纂的網站目錄。其中有些目錄會顯得古怪和輕浮,比如霍爾的“地下室鏈接”和保羅·菲利普斯(paul phillips)的“useless pages”。另外一些則是嚴肅正式的,比如蒂姆·伯納斯–李的萬維網虛擬圖書館(world wide web virtual library),國家超級計算應用中心的“what’s new”頁麵,以及蒂姆·奧萊利的全球網絡導航器(globalwork navigator)。處於這兩者之間的是一個成立於1994年初的網站,它將網站目錄的概念帶上了一個全新的台階。它的創始人是兩位斯坦福大學研究生,他們將這個網站命名為“傑裏和大衛的萬維網指南”(jerry and david’s guide to the web),當時許多同類網站都采用了類似的命名方式。
楊致遠(jerry yang)和大衛·費羅(david filo)對待博士論文的態度都很散漫,他們會因為玩模擬籃球經理遊戲而拖延完成論文的時間。“我們做各種事情,就是不寫論文。”楊致遠回憶道。113 為了從服務器上獲取球員的數據,楊致遠花了很多時間來研究ftp和gopher這兩種協議。在萬維網出現之前,它們是在互聯網上分發文檔的常用工具。
在mosaic瀏覽器推出之後,楊致遠將自己的注意力轉向了萬維網,他和費羅開始親手編纂一份不斷擴展的網站目錄。他們按照類別對不同的網站進行整理,例如商業、教育、娛樂、政府等,每個類別還會分成若幹個子類別。1994年底,他們將這個萬維網指南更名為“雅虎”(yahoo!)。
但是這個網站目錄存在一個顯而易見的問題:每年網站的數量都會呈現10倍的增長,因此他們不可能人工持續更新這個目錄。幸好當時已經出現了一種用於搜索ftp和gopher站點信息的工具——爬蟲(crawler)。這種工具被稱作爬蟲的原因是它會一個接一個地“爬進”互聯網的服務器,然後根據自身搜索到的信息建立索引。當時最著名的兩個爬蟲工具是archie(用於ftp)和veronica(用於gopher),它們的名字就像是漫畫書裏麵的英雄搭檔一樣。到了1994年,有許多勇於嚐試的工程師都開始製作用於搜索萬維網的爬蟲工具,其中包括麻省理工學院的馬修·格雷(matthew gray)開發的 wanderer,華盛頓大學的布萊恩·平克頓(brian pinkerton)開發的webcrawler,數字設備公司的路易斯·莫尼爾(louis monier)開發的altavista,卡內基–梅隆大學的邁克爾·莫爾丁(michael mauldin)開發的lycos,加拿大滑鐵盧大學的一支團隊開發的opentext,以及來自斯坦福大學的6位朋友開發的excite。所有這些爬蟲工具都采用了鏈接跳轉機器人,它們會對萬維網進行快速檢索。就像是在各家酒吧之間大肆豪飲的酒鬼一樣,它們會瘋狂地采集每個網站的網址和內容。然後這些信息會被標記和索引,並儲存在數據庫當中,以便查詢服務器的進一步調用。
費羅和楊致遠沒有開發自己的網絡爬蟲,他們選擇從其他地方購買一個爬蟲工具,然後應用在自己的主頁上。雅虎繼續強調人工編纂網站目錄的重要性。當用戶輸入一個關鍵詞之後,使用雅虎的計算機會查找本站目錄當中是否含有相關的條目。如果有的話,用戶就會看到一個經過人工編輯的相關網站列表。如果沒有的話,查找工作將會交由網絡爬蟲搜索引擎完成。
雅虎團隊錯誤地認為大部分用戶在上網的時候隻是瀏覽內容,而不是專門為了查找某些特定的東西。“從瀏覽和發現到現在的目的性搜索是一項令人難以置信的轉變。”雅虎的首位主編斯裏尼賈·斯裏尼瓦桑(srinija srinivasan)回憶道,她當時管理著一個雇有60位年輕編輯和目錄編纂人員的編輯室。114 這種依賴於人工編輯的做法意味著雅虎非常擅長挑選新聞報道。多年以來(甚至直到現在),它在這方麵的能力一直遙遙領先於競爭對手,但是它並不擅長提供搜索工具。然而,斯裏尼瓦桑和她的團隊不可能追趕上網頁數量增長的速度。自動化搜索引擎將會成為萬維網內容查找的主要方式,而這個潮流將由另外兩位斯坦福大學研究生引領。
拉裏·佩奇rry page)生長於一個計算機技術家庭。115 他的父親是密歇根大學的計算機科學和人工智能教授,他的母親也是那裏的編程講師。1979年,也就是在拉裏6歲的時候,他的父親買了一台叫作exidy sorcerer的業餘家用電腦回家。[6] “我還記得家裏剛買電腦的時候,我感到非常興奮,因為這可是一件大事,而且它的價格應該不便宜,就像是買一輛車一樣。”他說道。116 拉裏很快就學會了如何操作這台電腦,他還會用它來做作業。“我想我是小學裏麵第一個用文字處理文檔來交作業的孩子。”117
佩奇的童年偶像之一是尼古拉·特斯拉(nik te),這位充滿想象力的電學先驅擁有大量的發明,但是他在商業上被托馬斯·愛迪生擊敗了,最終在窮困潦倒中逝世。佩奇在12歲的時候讀到了一本特斯拉傳記,他認為這是一個悲哀的故事。“他是曆史上最偉大的發明家之一,但是他的故事實在令人感到痛心。”他說,“他不能將自己的任何發明變成商品,他的資金隻能勉強支撐自己的研究工作。你肯定會更想成為像愛迪生這樣的人。如果你隻是把一件東西發明出來,它不一定能夠為他人帶來幫助。要想真正地把它推廣給全世界,你必須把它生產出來,然後用賺到的錢繼續支持它的研究。”118
拉裏的父母在長途駕車旅行的時候經常會帶上他和他的哥哥卡爾,有時他們會一起參加計算機大會。“我想我在上大學的時候已經差不多去過美國的各個州了。”他說道。有一次,他們駕車前往溫哥華參加國際人工智能聯合大會(international joint conference on artificial intelligence),當時的會場上到處都是各種神奇的機器人。因為拉裏當時還未滿16歲,所以工作人員不允許他進入會場,但是他的父親堅持要帶他進去。“他直接對著他們大吼大叫。這是我為數不多看到他對其他人發脾氣的時候。”119
與史蒂夫·喬布斯和艾倫·凱一樣,拉裏在計算機以外的愛好是音樂。他會吹奏薩克斯,而且學習過作曲。每年暑假他都會到密歇根州北部參加著名的湖心音樂夏令營。這個夏令營采用了一種民主的方式來確定每個孩子的排名:在開營的時候,孩子們會被分配到樂團的各個席位,然後每個孩子都可以挑戰自己前一席位的人。在兩個孩子進行比賽的時候,其他孩子會背對他們聆聽他們演奏同一段音樂,然後投票選出哪一個演奏得更好。“經過一段時間之後,孩子們的排名就會穩定下來,而且每個人都能大概了解自己處於怎樣的水平。”他說道。120
密歇根大學不僅是佩奇的父母任教的地方,也是他們曾經上學和邂逅的地方,所以他們半開玩笑地叫佩奇以後也去那裏上學。而佩奇也確實去上了密歇根大學。他堅持要同時主修商科和計算機科學專業,其中一部分原因是特斯拉的故事給他帶來的啟示——這位大發明家始終無法把自己的發明變成商品。另外一部分原因是比他大9歲的哥哥卡爾起到的榜樣作用,後者在畢業之後成為一家早期社交網絡公司的聯合創始人,這家公司後來以4.13億美元的價格被雅虎收購了。
佩奇提到自己印象最深刻的一門大學課程是朱迪斯·奧爾森(judith olson)教授的人機交互課程。這門課程的目標是理解如何設計簡單而直觀的交互界麵。在這門課程的研究報告中,佩奇選定的主題是eudora郵件客戶端的顯示界麵,他對這個客戶端執行各種操作所需的時長進行了預估和測試。例如,他發現人們使用控製按鍵的操作速度實際上會比鼠標慢0.9秒。“我覺得自己建立了一種理解人們如何與屏幕進行交互的直覺,而且我意識到這些東西是非常重要的,”他說,“然而即使到了今天,這些仍然沒有得到很好的理解。”121
在大學期間的一個暑假裏,佩奇參加了由領導力培訓機構leadershape舉辦的一個集訓活動。該活動旨在鼓勵學生建立一種“積極地忽視不可能”的態度。這家機構反複向他灌輸這樣一個目標,就是發起一些其他人認為是大膽和瘋狂的項目,這也是他日後在穀歌一直追求的目標。在他發起的眾多項目當中,尤其大膽和瘋狂的是他在密歇根大學和後來推動的一些未來主義想法——個人交通係統和無人駕駛汽車。122
在申請研究生院的時候,佩奇被麻省理工學院拒絕了,但是斯坦福大學錄取了他。這其實是一件好事,對於那些有誌於同時涉足技術和商業的人來說,斯坦福大學是一個理想的去處。自從斯坦福畢業生西裏爾·埃爾韋爾(cyril elwell)在1909年創立聯邦電報公司(federal telegraph)以來,技術創業在這裏不僅是一種可以容忍的行為,而且是被廣為接受的。20世紀50年代初,在工程學院院長弗雷德·特曼將大學的部分土地改造成工業園區之後,斯坦福大學鼓勵創業的態度得到了進一步的鞏固。即便是在教員們的眼中,創業計劃的重要性也絲毫不亞於學術論文發表。“這正是我喜歡的那種教授,他們會將一隻腳伸進產業當中,而且希望做出一些顛覆世界的瘋狂事情,”佩奇說道,“斯坦福大學有很多這樣的計算機科學教授。”123
當時大部分的精英大學都將重點放在學術研究上,同時避免涉足商業領域。斯坦福大學率先認識到大學不應該隻是一個學術研究機構,而且可以是一個創業孵化器。由斯坦福大學成功孵化的企業包括惠普、思科、雅虎和太陽計算機係統等。這個列表中最響亮的一個名字最後將由佩奇加上,他認為這種觀點實際上會提升學校的學術研究水平。“我認為純理論方向的研究效率也得到了大大的提升,因為它是建立在現實世界的基礎上的,”他堅持道,“不僅僅是進行理論研究,你也希望自己的研究工作可以應用在實際的問題上。”124
佩奇在1995年秋季正式入讀斯坦福大學研究生院,他在開學之前還參加了一個新生培訓項目,其中有一天的培訓活動設在舊金山進行。當時的領隊是一位善於交際的二年級研究生謝爾蓋·布林(sergey brin)。佩奇是一個天生沉靜的人,但是布林卻是那種能連珠似炮地向他講述自己想法的人,他們很快就進入了關於各種話題的爭論當中,從計算機到城市功能分區無所不談,兩人一拍即合。“我記得自己當時覺得他很討厭,”佩奇承認道,“這種看法一直持續到現在。也許他也是這麽看我的吧。”125 他們確實是一對冤家。“我們都覺得對方很討厭,”布林也坦承,“不過我們隻是開玩笑而已。當然,我們進行了很長時間的交流,所以我們之間肯定有合得來的地方。我們喜歡互相取笑對方。”126
謝爾蓋·布林的父母也是學者,他們都是數學家,但是他的童年跟佩奇的非常不一樣。布林出生於莫斯科,他的父親是莫斯科國立大學的教授,他的母親是蘇聯石油與天然氣研究所的研究工程師。因為他們都是猶太人,所以他們的事業受到了諸多製約。“當時我們的家境貧寒,”謝爾蓋對記者肯·奧萊塔(ken auletta)說道,“我的父母都經曆過非常困難的時期。”當他的父親提交了移民申請之後,他們夫妻兩人同時失業了。他們一家的出境簽證在1979年5月獲批,當時謝爾蓋隻有5歲。在希伯來移民援助協會的幫助下,他們一家住進了一個工薪階層住宅區,他的父親在附近的馬裏蘭大學找到了一份數學教授的工作,他的母親也成為美國國家航空航天局戈達德太空飛行中心(nasa goddard space flight center)的研究員。
謝爾蓋入讀的是一所采用蒙特梭利教育法的學校,他在那裏培養出了獨立思考的能力。“沒有人告訴你應該做什麽,”他說,“你必須規劃好自己的道路。”127 這是他和佩奇之間的一個共同點。在後來被問到擁有身為教授的父母是不是他們取得成功的關鍵時,他們都表示入讀蒙特梭利式教育學校是一個更為重要的因素。佩奇的觀點是:“我認為有一部分原因來自我受到的教育——不要墨守成規,學會自我激勵,用懷疑的眼光看待世界,還有做出與眾不同的事情。”128
布林和佩奇的另外一個共同點是他們在小時候都收到過父母送的電腦,布林在9歲的時候收到了一modore 64電腦作為生日禮物。“當時為自己的電腦編程要比現在容易得多,”他回憶道,“那台電腦內置了一個basic編譯器,[7] 所以我可以馬上開始編寫自己的程序,”在中學時期,布林和一個朋友嚐試編寫一些可以和用戶進行文本對話的程序,希望從中模仿出人工智能。“我認為現在這些接觸電腦的孩子們已經不像我以前那麽容易進入編程的世界了。”129
然而布林對待權威的叛逆態度差點為他惹上大麻煩。在他即將17歲的時候,他的父親帶他回到莫斯科進行參觀。他在莫斯科的路上看到一輛警車,他忍不住朝警車扔了塊石子。車上的兩位警官走下來準備教訓謝爾蓋,幸好他的父母幫他化解了這場危機。“我認為自己的叛逆精神來自我出生於莫斯科這個事實,而這種叛逆精神一直伴隨我到成年之後。”130
物理學家理查德·費曼(richard feynman)的幾本回憶錄讓布林深受啟發,費曼非常推崇將藝術和科學結合在一起的做法,正如列奧納多·達·芬奇那樣。“我記得其中有一部分內容是他講述自己多麽想成為列奧納多——一個集藝術家和科學家於一身的人,”布林說道,“這種想法對我很有啟發,我覺得這是一條通向充實人生的道路。”131
布林分別用三年的時間完成高中和大學本科的學業,他在馬裏蘭大學主修的是數學和計算機科學雙專業。有一陣子,他喜歡和自己的電腦極客朋友們一起在互聯網電子公告欄和聊天室打發時間,不過在發現這些地方充斥著“10歲的男孩們在嚐試談論性愛”之後,他就把注意力轉向了以文本為基礎的多用戶地下城(mud)在線遊戲,他甚至編寫了一個自己的mud遊戲,裏麵有一個運送爆炸物包裹的郵差。“在mud遊戲上花了一些時間之後,我發現這是一個非常酷的東西。”布林回憶道。132 在1993年春天,也就是布林在馬裏蘭大學的最後一年,他下載了安德森剛剛發布的mosaic瀏覽器,緊接著他就被萬維網深深吸引住了。
布林在獲得國家科學基金會的獎學金之後進入了斯坦福大學,他在那裏的研究重點是數據挖掘(同樣,麻省理工學院也拒絕了布林的研究生申請,不過現在看來損失更大的似乎是麻省理工)。在正式入讀博士研究生院之前,布林需要先通過8項綜合性的測試,他在報到之後不久就順利通過了其中7項測試。“我認為自己最擅長的一項測試卻沒有通過,”他回憶道,“於是我去找評分的教授為自己的答案爭辯,並成功說服了他,最終我通過了全部8項測試。”133 這之後他就可以自由選擇喜歡的任何課程,同時沉浸在自己的特殊運動愛好當中——包括雜技、秋千、帆船、體操和遊泳。他可以倒立行走,他還說自己曾經想過要離家出走加入馬戲團。他也是直排輪滑運動的狂熱愛好者,經常有人會看到他在過道之間呼嘯而過。
在佩奇入讀斯坦福大學幾個星期之後,他和布林連同計算機科學係的其他學生都搬進了新建的蓋茨計算機科學大樓。[8] 布林認為建築師製定的辦公室編號方式過於平庸,於是他設計了一種新的編號方式,它能夠更好地表示每個房間的位置和它們之間的距離,這種方式最終得到了采納。“可以說,這個新的編號方式確實非常直觀。”他說道。134 佩奇和另外三位研究生被分配到了一個房間,布林把這裏當成自己的大本營。這個房間裏麵有由電腦控製澆水的懸掛植物、一台連接到電腦的鋼琴、各種各樣的電子玩物,還有為小睡和通宵工作準備的睡墊。
人們用駝峰式拚寫法為這對形影不離的組合取了一個外號——rryandsergey”,他們在進行爭論或者取笑對方的時候就像是兩把互相交鋒的寶劍。他們辦公室裏唯一的女生塔瑪拉·蒙茲納(tamara munzner)稱他們有股“傻傻的聰明”,這點尤其體現在他們為一些荒謬的想法而爭論的時候,比如能否隻以青豆為材料製成樓房大小的建築。“和他們共用一間辦公室是非常有趣的,”她說,“我們在一起的時候都玩得很瘋狂。我記得在一個周六晚上,直到淩晨3點,辦公室裏麵仍然擠滿了人。”135 這對組合不僅以頭腦聰明著稱,在其他人眼中他們還是膽大妄為的。“他們不會假裝尊重權威,”他們的一位導師拉傑夫·莫特瓦尼(rajeev motwani)教授表示,“他們總是質疑我,他們會毫不顧忌地對我說‘你講的東西都是垃圾!’”136
跟其他優秀的創新搭檔一樣,rryandsergey”也有著互補的個性。佩奇不是一個熱衷社交的人,他可以一直盯著電腦屏幕,卻不敢和陌生人進行眼神接觸。他的聲帶因為一次病毒感染而患上了慢性疾病,因此他說話時的嗓音會比較低沉和沙啞,他還有一個令人不快的習慣,就是他有時候會完全陷入沉默(這從很多方麵來看其實是個好習慣),因此他偶爾說出的話語會給人留下更為深刻的印象。佩奇有時會完全沉浸在自己的世界中,但有時也會積極地與人交流。他的笑容往往隻是一閃而過,卻能讓人感受到真摯。他的臉部表情很豐富,他在聆聽別人說話時的專注既讓人感到高興也令人緊張。理性而嚴謹的他可以指出最為常見的論述當中的邏輯問題,也可以輕易地將膚淺的對話轉變為深刻的討論。
而布林有時也會表現得傲慢無禮,但是他的行為卻不會惹人反感。他會未經敲門就闖入其他人的辦公室,不假思索地講出自己的想法和要求,或者隨時加入到任何話題的討論當中。相比之下,佩奇則是一個更為謹言慎行的人。當布林為自己找得某種可行的方法而沾沾自喜的時候,佩奇會深入思考這種方法可行的原因。熱情健談的布林通常都是討論的主導者,而佩奇在討論結束時的低聲評論卻能引人側身傾聽。“也許我要比謝爾蓋更靦腆一些,不過他某些方麵也挺害羞的,”佩奇評論道,“我們有很好的合作關係,我的思維可能會比較廣闊,而且我們掌握的技能也不一樣。我接受的是計算機工程師的訓練,所以我對硬件知識比較在行,但他擁有比我更深厚的數學背景。”137
布林身上有一點讓佩奇感到尤其了不起的是他的聰明才智。“我想說的是,即便是在計算機科學係的學生當中,他也是絕頂聰明的。”除此之外,布林的外向性格也能為他俘獲人心。當佩奇剛剛進入斯坦福大學的時候,他和其他新入學的研究生都被安排在一間被稱為“牛欄”(bullpen)的寬敞房間裏麵。“謝爾蓋非常喜歡交際,”佩奇說道,“他會去結識每一位新生,來熱身區和我們交流。”布林甚至擁有一種和教授交朋友的本領。“謝爾蓋可以走進教授們的辦公室跟他們閑聊,這對於一位研究生來說是比較不尋常的。我想他們容許他這樣做的原因是他是一個非常聰明且博學的學生,他對各種各樣的話題都能提出建設性的想法。”138
佩奇加入了斯坦福大學的人機交互小組,這個團隊的工作是探索改善人機共生關係的方法。人機交互是由利克萊德和恩格爾巴特率先提出的研究領域,同時也是佩奇在密歇根大學最喜歡的課程。他成為以用戶為中心的設計概念的支持者,這種概念強調的是軟件和計算機的界麵必須直觀,而且用戶永遠都是正確的。他在斯坦福大學的論文導師是特裏·威諾格拉德(terry winograd),這位性格開朗的教授留著像愛因斯坦一樣的發型。威諾格拉德之前的研究方向是人工智能,但是在深入思考了人類認知的本質之後,他將自己的研究重點轉向如何利用機器增強和擴展(而不是複製和取代)人類的思想。“我的研究方向從人工智能轉向了一個更加寬泛的問題,‘你想如何與一台計算機進行交互?’”威諾格拉德表示。139
雖然人機交互和界麵設計是利克萊德留下的寶貴財富,但是它在當時仍然被認為是一個相當弱勢的專業,講求實際的計算機科學家們都認為它隻不過是一個由心理學教授任教的科目,而利克萊德和朱迪斯·奧爾森都是心理學教授出身。根據佩奇的說法:“對於研究圖靈機或同類課題的人來說,人類反應的處理是非常情感化的,這種感覺就像是陷入了人文學科的研究當中。”威諾格拉德幫助改善了這個領域的聲譽。“特裏在研究人工智能的過程中建立了過硬的計算機科學背景,但他對人機交互也很感興趣,當時涉足這一領域的人不多,而且我認為它沒有得到足夠的尊重。”用戶界麵設計課程的電影製作課是佩奇最喜歡上的課之一。“它向我證明了電影的語言和技巧確實可以應用於計算機界麵設計。”他說道。140
布林的學術研究重點是數據挖掘。他和莫特瓦尼教授一起成立了一個叫作斯坦福數據挖掘(mining data at stanford,midas)的小組。在他們共同發表的論文當中——該小組的成員還包括另外一位研究生克雷格·希爾弗斯坦(craig silverstein),他後來成為穀歌的第一位員工——有兩篇是關於購物籃分析的。購物籃分析是對顧客購買商品種類的關聯性的分析。141 在這兩篇論文的寫作過程中,布林開始對萬維網數據模式的分析方法產生了興趣。
在威諾格拉德的幫助下,佩奇開始思考自己的博士論文題目。他考慮了超過10個題目,其中有一個是關於如何設計自動駕駛汽車的,這是穀歌之後會研究的一個項目。他最終選定了一個自己比較熟悉的題目——如何評估不同網站之間的相對重要性。他采用的研究方法來自他所處的家庭學術環境。如果要知道一篇學術論文的價值,其中一個判斷標準是它在其他論文的注解和參考文獻部分被引用的次數。按照同樣的理論,如果要判斷某個網頁的價值,其中一種方法是了解鏈接到該網頁的其他網頁的數量。
但是這種方法存在一個問題。蒂姆·伯納斯–李在設計萬維網的時候,他的理念是任何人都可以在未經允許的情況下建立指向其他網頁的鏈接,將網頁鏈接保存在數據庫中,或者雙向使用鏈接。不過這正是包括泰德·尼爾森在內的超文本純粹主義者所擔心的做法。雖然這個理念讓萬維網得以迅速擴張,但是這也意味著人們將無法輕易得知指向某個網頁的鏈接數量或者來源。你可以在一個網頁上看到所有向外的鏈接,但你不能看到指向這個網頁的鏈接的數量和質量。“在我見過的協作係統當中,萬維網的協作功能是相對較弱的,因為它的超文本存在一個缺陷:它沒有雙向鏈接。”佩奇說道。142
於是佩奇開始嚐試建立一個含有大量鏈接的數據庫,這樣他就可以反向追蹤這些鏈接,找出每個網頁的鏈接會通向什麽網站。這項工作的其中一個目的是促進協作。他打算讓人們在自己的網頁上為其他網頁添加注釋,如果哈利將自己的評論鏈接到了薩莉的網站,那麽正在瀏覽這個網站的人就可以前往查看哈利的評論。“在實現了反向鏈接追蹤之後,人們隻需鏈接到某個網站就可以對其進行評論或者注釋。”佩奇解釋道。143
佩奇用於實現反向鏈接的方式來自一個大膽的想法——這是他在一天半夜醒來之後突然想到的。“我當時在想:如果我們可以把整個萬維網下載下來,然後隻將其中的鏈接保存下來,那會怎樣呢?”他回憶道,“我馬上拿起了一支筆,記下自己的想法。整個後半夜我都在完善這個想法的細節,並說服自己這是可行的。”144 這次的半夜工作經曆給他上了一課。“你必須給自己定下不太可能實現的目標,”他後來對一群以色列學生說道,“我在大學期間學到了一句話:‘積極地忽視不可能。’這句話說得非常好。你們應該嚐試一些大多數人都不敢做的事情。”145
要把整個萬維網記錄下來可不是一件易事。即使是在1996年1月的時候,全世界已經有10萬個網站,這些網站總共含有1 000萬個文檔,它們之間的鏈接有近10億條,而且這些數字每年都會呈現指數級增長。在當年初夏,佩奇設計了一個網絡爬蟲工具,它會從佩奇的個人主頁出發,一直跟蹤它遇到的所有鏈接。這隻在萬維網上迅速移動的蜘蛛會保存每條超鏈接的文本和來源,以及它們對應網頁的標題。他將這個項目命名為“backrub”。
佩奇向自己的導師威諾格拉德表示,他粗略估計自己的網絡爬蟲將會在幾個星期之內完成這項任務。“特裏故意點了點頭,他明明知道這需要花費比我想象中長得多的時間,但是他明智地向我隱瞞了這點;”佩奇回憶道,“人們經常會低估年輕人的樂觀精神!”146 這個項目很快就占用了斯坦福大學幾乎一半的互聯網帶寬,而且它至少造成了一次全校範圍內的網絡中斷,但是學校的行政人員仍然對此保持比較寬容的態度。“我的磁盤空間幾乎已經用完了。”佩奇在1996年7月15日向威諾格拉德發了一封郵件,他當時已經收集了2 400萬條網址和超過1億條鏈接。“雖然我當時隻保存了大概15%的網頁,不過情況看起來非常樂觀。”147
佩奇這個大膽而複雜的項目吸引了擁有數學頭腦的謝爾蓋·布林的注意,後者當時正在尋找一個合適的博士論文題目。他興致勃勃地加入了自己好友的工作當中:“這是最令人興奮的一個項目,不僅因為它與代表人類知識的萬維網相關,也因為我喜歡拉裏這個人。”148
backrub項目在當時的目標仍然是收集萬維網的反向鏈接,為將來可能實現的注釋係統和引用分析功能打下基礎。“現在想來不可思議的是,我當時完全沒有想過要建立一個搜索引擎。”佩奇說道,“這個想法甚至不在我們的考慮範圍之內。”隨著這個項目的逐步推進,他和布林想出了一些更為複雜的網頁價值分析方法,這些方法采用的依據是指向每個網頁的鏈接的數量和質量。這時候,他們逐漸認識到這個按照重要性排名的網頁索引可以成為一個高質量搜索引擎的基礎。這就是穀歌誕生的由來。“當一個偉大的夢想出現的時候,”佩奇後來說道,“你要馬上抓住它!”149
這個經過改進的項目最初被稱為“pagerank”,因為它會對backrub索引收集到的每個網頁進行排名。當然,這個名字還體現了佩奇的諷刺幽默感和小小的虛榮心。“不好意思,它確實是指我自己。”他後來羞怯地承認道,“我其實對此感到有點難為情。”150
網頁排名的目標還會引出另外一個複雜的問題。佩奇和布林意識到除了對指向網頁的鏈接數量進行匯總以外,他們還可以嚐試確定每條進入鏈接的價值。例如,來自《紐約時報》的鏈接應該要比賈斯汀·霍爾在斯沃斯摩爾學院宿舍發出的鏈接有更高的價值。這樣就建立了一個由多個反饋循環形成的遞歸過程:每個頁麵的排名依據是進入鏈接的數量和質量,而這些鏈接的質量是由生成它們的頁麵的數量和質量來決定的,以此類推。“整個過程都是遞歸的,”佩奇解釋道,“這是一個巨大的循環。不過數學的力量是很強大的,它可以幫助我們解決這個問題。”151
布林能夠充分理解這種類型的數學難題。“事實上我們想出了很多數學方法來解決這個問題,”他回憶道,“我們將整個萬維網轉換成一組含有數億個變量的龐大方程,這些變量就是所有網頁的排名。”152 在各自導師的指導之下,他們為此合著了一篇論文。他們在其中清晰地講述了這些複雜數學公式的基礎——網頁含有的進入鏈接數量以及每條鏈接的相對排名。然後他們用外行人都能明白的簡單語言解釋道:“如果一個網頁的反向鏈接的整體排名越高,那麽這個網頁本身的排名就越高。這裏同時考慮到了頁麵擁有大量反向鏈接和少量高排名鏈接的情況。”153
那麽pagerank真的可以生成更好的搜索結果嗎?這是一個價值10億美元的問題。他們為此進行了一項對比測試。他們用到的測試關鍵詞之一是“大學”(university)。如果在altavista和其他引擎搜索這個關鍵詞,它們會列出在標題中含有該關鍵詞的隨機頁麵。“我記得自己曾經問過他們,‘為什麽你們要提供這樣的垃圾結果?’”佩奇說道。對方給出的回應是,沒有得到合適的搜索結果是佩奇的問題,他應該改善自己使用的搜索關鍵詞。“我在人機交互的課程上學習到抱怨用戶並非一個好的策略,所以我知道他們根本就沒有把事情做好。‘用戶永遠是對的’這一觀念讓我們可以做出一個更好的搜索引擎。”154 在pagerank中,以“大學”為關鍵詞的最優先搜索結果分別為斯坦福大學、哈佛大學、麻省理工學院和密歇根大學,他們對這個結果感到十分滿意。“哇噢!”佩奇記得自己當時發出了這樣的讚歎,“我和小組的其他成員都清楚地認識到,如果我們在為網頁進行排名的時候能夠參考外界對這個網頁的看法,而不是僅僅關注網頁本身,這將會對網頁搜索帶來很大的幫助。”155
為了繼續完善pagerank的搜索結果,佩奇和布林加入了更多的參考因素,例如關鍵字在網頁上出現的頻率、字號和位置。如果關鍵字出現在網址中,使用了大寫形式,或者包含在標題內,對應的網頁就會得到更高的排名。他們會對比采用不同參數組合的搜索結果,然後不斷調整和改進算法。他們發現應該對錨文本給予較高的權重,錨文本指的是作為超鏈接的下劃線文本。例如,“比爾·克林頓”是許多指向美國白宮網站(whitehouse.gov)的鏈接的錨文本,因此當用戶搜索“比爾·克林頓”的時候,白宮網站應該出現在最優先的搜索結果,盡管這個網站的主頁中沒有明顯地出現比爾·克林頓這個名字。相比之下,用戶在另外一個競品上搜索“比爾·克林頓”的時候,得到的第一條搜索結果是“今日的比爾·克林頓笑話”。156
由於這個搜索引擎需要處理海量的頁麵和鏈接,所以佩奇和布林把它命名為穀歌(google),這個名字來源於古戈爾(googol)——是指1後有100個0。提出這個名字的人是他們辦公室的另外一位研究生肖恩·安德森(sean anderson)。他們在瀏覽器中輸入“google”,發現這個域名仍然可用,於是佩奇把它搶注了下來。“我不確定我們是否意識到自己犯了一個拚寫錯誤,”布林後來說道,“不過‘googol’域名已經被占用了。之前已經有人注冊了‘googol’,我試過向那個人提出購買域名的請求,但是對方非常喜歡這個域名,所以不願意出售。因此我們還是選擇了‘google’。”157 這是一個很好玩的單詞——簡單易記,輸入方便,還可以轉換成動詞來使用。[9]
佩奇和布林從兩個方麵繼續改進穀歌的使用體驗。首先,他們建立了比任何競爭對手都高出許多的網絡帶寬、處理能力和儲存容量,從而將他們的網絡爬蟲的處理速度提升至每秒索引100個網頁。除此之外,他們還非常熱衷於研究用戶行為,這點有助於持續改進他們的算法。如果用戶在點擊了最優先的搜索結果之後沒有返回搜索結果列表,這就意味著他們已經找到了自己想要的東西。但是如果他們在完成搜索之後立刻修改自己的關鍵詞,就說明他們對搜索結果不滿意,這時候工程師們就需要查看用戶修改過的搜索關鍵詞,從而了解他們最初想要查找的東西。用戶每次跳轉到第二頁或第三頁搜索結果的時候都表明他們對搜索結果的排序不滿意。按照記者史蒂文·利維的說法,這個反饋循環可以幫助穀歌學習到用戶的真正意圖,當用戶輸入“狗”(dogs)的時候,他們可能也想查找小狗(puppies);他們在輸入“沸騰”(boiling)的時候可能是指熱水(hot water)。當然,穀歌也學會了用戶在輸入“熱狗”(hot dog)的時候並不是想查找“沸騰的小狗”(boiling puppies)。158
還有另外一個人也想到了跟pagerank非常相似的基於鏈接的網頁排名機製:一位來自中國的計算機工程師李彥宏。他曾經在紐約州立大學水牛城分校學習,在碩士畢業後,他開始為道瓊斯公司位於新澤西州的一家子公司工作。1996春天,也就是佩奇和布林正在啟動pagerank項目的時候,李彥宏想出了一個叫作“rankdex”的算法,它可以根據進入網頁鏈接的數量和鏈接錨文本的內容確定搜索結果的權重。他買了一本書自學如何為這個想法申請專利,並在道瓊斯公司的幫助下完成了專利的申請。但是道瓊斯公司沒有繼續推進這個想法,於是李彥宏加入了位於矽穀的infoseek公司,後來返回中國。他在回國之後和其他人共同創立了百度,成為中國最大的搜索引擎,而且是穀歌在全球範圍內最有實力的競爭對手之一。
到了1998年年初,佩奇和布林的數據庫已經收錄了5.18億條超鏈接,而當時萬維網的鏈接總數約為30億條。佩奇不希望穀歌僅僅停留在學術項目的層麵,他想盡快把它打造成為一款熱門產品。“這就像是尼古拉·特斯拉麵臨的問題,”他說,“如果你有一個自認為不錯的發明,你會想讓它盡快被多數人用上。”159
因為佩奇和布林想將自己的博士論文付諸實踐變成一家公司,所以他們不願意對已有的工作成果進行發表或者正式展示。但是他們的導師卻一直催促他們發表一些東西出來,於是他們在1998年春天完成了一篇20頁的論文,他們在其中解釋了pagerank和穀歌背後的學術理論,但是沒有向競爭對手透露過多的商業機密。1998年4月,這篇題為《一個大規模超文本萬維網搜索引擎的剖析》的論文發表於一場在澳大利亞舉行的計算機大會上。
“我們會在本論文中介紹穀歌,一個倚重於超文本架構的大規模搜索引擎的原型。”他們在論文的開頭寫道。160 在收集了萬維網上總共30億條鏈接當中的大約5億條之後,他們能夠計算出至少2 500萬個網頁的排名,這點“相當符合人們對重要性的排名需求”。他們詳細講述了產生每個網頁的排名的“簡單迭代算法”。“學術參考文獻的引用方式已經被應用到萬維網之上,主要的方法是計算指向給定網頁的引用或反向鏈接數量。pagerank進一步拓展了這個概念,它不會為來自所有網頁的鏈接給予同等的權重。”
這篇論文含有大量關於排名、爬蟲、索引和迭代算法的技術細節,還有一部分內容講述了一些在未來有價值的研究方向。不過論文的結尾明確指出了這個項目不是一次學術實踐或者研究工作,他們進行這項工作的目標顯然是成立一家商業公司。“穀歌的設計目的是成為一個可擴展的搜索引擎,”他們在論文的結論中宣稱,“我們的首要目標是提供高質量的搜索結果。”
如果是在那些主要以學術為目的而進行研究的大學裏麵,他們的做法也許是有問題的。但是斯坦福大學不僅允許學生參與商業項目,而且還會為他們提供鼓勵和幫助。學院甚至還有專門幫助學生完成專利申請和授權事宜的辦公室。“我們斯坦福大學擁有促進創業精神和冒險研究的環境,”校長約翰·亨尼斯(john hennessey)強調,“這裏的人們深刻地理解到一點——有時候改變世界的最佳方式不是寫論文,而是將你相信可行的技術變成真正的產品。”161
佩奇和布林嚐試商業化的第一步是向其他公司授權使用他們的軟件,他們會見了雅虎、excite和altavista等公司的首席執行官。這些公司的出價是100萬美元,不過這也不算是一個天文數字,因為除了專利授權的費用以外,這筆資金還包含了他們兩人提供服務的酬勞。“當時這些企業的市值已經達到數億美元甚至更高,”佩奇後來說道,“所以這對於他們來說隻是一個小數目。但是他們的領導層缺乏足夠的遠見,他們有很多人都跟我們說:‘搜索其實沒有那麽重要。’”162
於是佩奇和布林決定成立他們自己的公司。他們所在的地理位置是一個適合創業的地方,在距離斯坦福校園幾英裏之外就有一些願意成為天使投資人的成功企業家,而且不遠的沙丘路上都是雄心勃勃的風險投資人,他們都可以為創業公司提供啟動資金。斯坦福大學有一位叫戴維·切裏頓(david cheriton)的教授,他曾經和安迪·貝希托爾斯海姆(andy bechtolsheim)共同創辦過一家銷售以太網產品的公司,這家公司後來被思科係統公司收購了。1998年8月,切裏頓建議佩奇和布林與貝希托爾斯海姆進行一次會麵,後者還是太陽計算機係統公司的聯合創始人之一。在一天深夜,布林向貝希托爾斯海姆發了一封郵件,對方立刻回複了布林。第二天早上,他們齊聚在位於帕洛阿爾托的切裏頓家中會麵。
即便是在青澀的學生時代,佩奇和布林也能為他們的搜索引擎做出激動人心的演示。他們展示了自己可以在一組小型計算機上對萬維網的大部分內容進行下載、索引和網頁排名的操作。這是在互聯網泡沫最大的時期進行的一次愉快會麵,貝希托爾斯海姆在會議上提出的問題也很有啟發性。他每個星期都會聽到很多場融資演講,但是他知道這跟那些根本不存在的霧件(vaporware)[10] 的幻燈片展示不一樣,他可以親手輸入搜索關鍵字,然後馬上就可以看到一些比altavista優秀得多的搜索結果。另外,兩位創始人都非常聰明且充滿幹勁,他就喜歡在這種類型的創業者身上押賭注。貝希托爾斯海姆很欣賞他們不打算在市場營銷方麵花費太多資金的想法(或者說他們實在不想在這方麵花費任何資金)。他們知道穀歌是一個足夠優秀的產品,它可以通過用戶之間的口碑來傳播,所以他們籌集到的每一分錢都會花在組裝服務器所需的零件上。“其他網站都會將很大一部分的風險資金花在廣告上麵,”貝希托爾斯海姆說道,“他們卻反其道而行之——先做出一些有價值的東西,推出一項足以吸引用戶使用的服務。”163
雖然布林和佩奇都不太願意接受廣告,但是貝希托爾斯海姆知道在搜索結果頁麵加入一些清晰標注的廣告是很容易做到的,而且不會影響用戶體驗。這就意味著他們已經擁有了一個等待挖掘的巨大收入來源。貝希托爾斯海姆對他們說道:“這是我在近年來聽到過的最棒的想法。”然後他們談到了具體的投資金額,貝希托爾斯海姆說他們的開價太低了。“好吧,我也不想浪費時間,”貝希托爾斯海姆最後說道,還有很多工作等著他去做,“我給你們寫一張支票,我想它肯定可以幫到你們。”他從自己的車上拿出了一個支票本,然後向穀歌公司開出了一張10萬美元的支票。“我們現在還沒有銀行賬戶呢。”布林告訴他。“那等你們開了賬戶之後再存進去把。”貝希托爾斯海姆回應道,之後就開著自己的保時捷跑車絕塵而去。
布林和佩奇一起去了漢堡王餐廳慶祝。“我們覺得應該吃一些好吃的東西,盡管那些食物確實很不健康,”佩奇說道,“而且價格也很便宜。對於這次的成功融資來說,這似乎也是一種合適的慶祝方式。”164
貝希托爾斯海姆開給“穀歌公司”的那張支票讓他們有動力開始組建一家公司。“我們必須盡快找到一位律師。”布林如是說。165 佩奇回憶道:“當時的感覺就像是,哇噢!也許我們真的要馬上開一家公司了。”166 由於貝希托爾斯海姆的聲譽(以及穀歌的產品本身足夠優秀),這個項目也吸引了其他投資人的加入,其中包括亞馬遜網站的傑夫·貝佐斯。“我真的愛上了拉裏和謝爾蓋,”貝佐斯表示,“他們具有以用戶為中心的遠見。”167 穀歌的名聲在人們的交口稱讚當中變得越來越響亮,以至於在幾個月之後,位於矽穀的兩家頂尖風險投資公司——紅杉資本和凱鵬華盈都對它進行了投資,很少有創業公司可以同時得到這兩家競爭對手的青睞。
除了樂於幫助學生的大學、熱心的導師和風險投資人以外,矽穀還有另外一個特色:這裏有許多車庫,而休利特和帕卡德設計他們第一款產品的地方,以及喬布斯和沃茲尼亞克組裝出第一塊apple i電腦主板的地方——正是在這樣的車庫裏。一心準備創業的佩奇和布林決定擱置他們的論文計劃並離開斯坦福大學的象牙塔,這時候他們找到了一個可以作為落腳點的車庫。他們在就讀斯坦福大學期間認識了一位名叫蘇珊·沃西基(susan wojcicki)的朋友(她在不久後也成為穀歌的員工),她家就住在學校附近的門洛帕克,於是他們以每月1 700美元的租金租下了她家的雙車位車庫,連同一個浴缸和幾間空置的房間。1998年9月,也就是在和貝希托爾斯海姆見麵的一個月之後,佩奇和布林開設了一個銀行賬戶,把那張支票兌現了。他們在車庫的牆上掛了一塊白板,上麵寫著“穀歌全球總部”。
除了將整個萬維網的信息囊括其中以外,穀歌還代表了人機關係領域的一項重大飛躍,也就是利克萊德在40年前構想的“人機共生關係”。雅虎之前嚐試通過結合自動搜索和人工編纂目錄的方法實現一種初級形式的人機共生關係。乍看之下,佩奇和布林所使用的方法是將人工的操作排除在外,完全使用網絡爬蟲和計算機算法來進行搜索。但是如果對其進行深入思考的話,我們會發現,他們的方法實際上是機器和人類智慧的結合。他們的算法依賴於人們在自己的網站上創建鏈接時做出的數十億次判斷。這是一種自動利用人類智慧的方式,換句話說,這是一種更高層次的人機共生關係。“這個過程看起來似乎是完全自動化的,”布林解釋道,“但事實上最終的成果是由數百萬人共同打造出來的,他們花了大量的時間在設計網頁和確定鏈接來源上,這就是它背後的人為因素。”168
在那篇發表於1945年的著名文章《誠如所思》之中,萬尼瓦爾·布什提出了一項艱巨的任務:“人類的經驗總和正以驚人的速度增長,但是我們從隨之而來的知識迷宮中獲取重要信息的方法卻與大航海時代別無二致。”布林和佩奇在離校創業之前提交的那篇論文中也提到了同樣的觀點:“索引中的文檔數量已經出現了多個數量級的增長,但是用戶查找文檔的能力卻沒有隨之提升。”雖然他們的文采不如布什,但是他們已經成功實現了他的夢想——通過人機協作來應對信息過載。穀歌也由此創造了一個人類、計算機和網絡緊密鏈接的世界,而實現這一成就用了60年的時間。任何人都可以向世界各地的人們分享任何信息,就像是那本來自維多利亞時代的年鑒所承諾的一樣——“包羅萬象”。
[1] 與萬維網的http協議類似,gopher是一個互聯網(tcp/ip)應用層協議。它主要利用基於菜單的導航來實現在線查找和分發文檔(通常是文字文檔)。它的鏈接是在服務器端處理的,而不是內嵌到文檔當中。它的名字取自明尼蘇達大學的吉祥物,另外它也是“go for”(努力爭取)的諧音。
[2] 一年後,安德森與一位成功的連續創業家吉姆·克拉克(jim rk)共同成立了一家叫作網景scape)的公司,這家公司的產品是一款商用版本的mosaic瀏覽器。
[3] 比特幣和其他加密貨幣都是通過結合數字加密技術和密碼學原理創造的去中心化控製的安全貨幣。
[4] 牛津英語詞典在2003年3月將“blog”作為名詞和動詞收錄在內。
[5] 值得注意和表揚的是,維基百科上關於自身發展曆史,以及威爾士和桑格起到的真正作用的條目(在討論版中經過了激烈的爭論之後)是公正客觀的。
[6] 這款電腦的設計者是比特商店(byte shop)的老板保羅·特雷爾(paul terrell),他曾經為自己的商店訂購了世界上前50台apple i電腦。
[7] 這是比爾·蓋茨編寫的編譯器。
[8] 蓋茨分別為哈佛大學、斯坦福大學、麻省理工學院和卡內基梅隆大學捐建了一座計算機大樓。其中位於哈佛大學的馬克斯韋爾–德沃金(maxwell dworkin)大樓是由他和史蒂夫·鮑爾默共同捐建的,該大樓的名字取自他們兩位的母親。
[9] 牛津英語詞典在2006年將“google”作為動詞收錄在內。
[10] 霧件是指在互聯網行業,在未開發完成前就開始做宣傳的某項產品或技術,但最後它們可能並不會問世。——編者注
最早嚐試做到這點的是一些人工編纂的網站目錄。其中有些目錄會顯得古怪和輕浮,比如霍爾的“地下室鏈接”和保羅·菲利普斯(paul phillips)的“useless pages”。另外一些則是嚴肅正式的,比如蒂姆·伯納斯–李的萬維網虛擬圖書館(world wide web virtual library),國家超級計算應用中心的“what’s new”頁麵,以及蒂姆·奧萊利的全球網絡導航器(globalwork navigator)。處於這兩者之間的是一個成立於1994年初的網站,它將網站目錄的概念帶上了一個全新的台階。它的創始人是兩位斯坦福大學研究生,他們將這個網站命名為“傑裏和大衛的萬維網指南”(jerry and david’s guide to the web),當時許多同類網站都采用了類似的命名方式。
楊致遠(jerry yang)和大衛·費羅(david filo)對待博士論文的態度都很散漫,他們會因為玩模擬籃球經理遊戲而拖延完成論文的時間。“我們做各種事情,就是不寫論文。”楊致遠回憶道。113 為了從服務器上獲取球員的數據,楊致遠花了很多時間來研究ftp和gopher這兩種協議。在萬維網出現之前,它們是在互聯網上分發文檔的常用工具。
在mosaic瀏覽器推出之後,楊致遠將自己的注意力轉向了萬維網,他和費羅開始親手編纂一份不斷擴展的網站目錄。他們按照類別對不同的網站進行整理,例如商業、教育、娛樂、政府等,每個類別還會分成若幹個子類別。1994年底,他們將這個萬維網指南更名為“雅虎”(yahoo!)。
但是這個網站目錄存在一個顯而易見的問題:每年網站的數量都會呈現10倍的增長,因此他們不可能人工持續更新這個目錄。幸好當時已經出現了一種用於搜索ftp和gopher站點信息的工具——爬蟲(crawler)。這種工具被稱作爬蟲的原因是它會一個接一個地“爬進”互聯網的服務器,然後根據自身搜索到的信息建立索引。當時最著名的兩個爬蟲工具是archie(用於ftp)和veronica(用於gopher),它們的名字就像是漫畫書裏麵的英雄搭檔一樣。到了1994年,有許多勇於嚐試的工程師都開始製作用於搜索萬維網的爬蟲工具,其中包括麻省理工學院的馬修·格雷(matthew gray)開發的 wanderer,華盛頓大學的布萊恩·平克頓(brian pinkerton)開發的webcrawler,數字設備公司的路易斯·莫尼爾(louis monier)開發的altavista,卡內基–梅隆大學的邁克爾·莫爾丁(michael mauldin)開發的lycos,加拿大滑鐵盧大學的一支團隊開發的opentext,以及來自斯坦福大學的6位朋友開發的excite。所有這些爬蟲工具都采用了鏈接跳轉機器人,它們會對萬維網進行快速檢索。就像是在各家酒吧之間大肆豪飲的酒鬼一樣,它們會瘋狂地采集每個網站的網址和內容。然後這些信息會被標記和索引,並儲存在數據庫當中,以便查詢服務器的進一步調用。
費羅和楊致遠沒有開發自己的網絡爬蟲,他們選擇從其他地方購買一個爬蟲工具,然後應用在自己的主頁上。雅虎繼續強調人工編纂網站目錄的重要性。當用戶輸入一個關鍵詞之後,使用雅虎的計算機會查找本站目錄當中是否含有相關的條目。如果有的話,用戶就會看到一個經過人工編輯的相關網站列表。如果沒有的話,查找工作將會交由網絡爬蟲搜索引擎完成。
雅虎團隊錯誤地認為大部分用戶在上網的時候隻是瀏覽內容,而不是專門為了查找某些特定的東西。“從瀏覽和發現到現在的目的性搜索是一項令人難以置信的轉變。”雅虎的首位主編斯裏尼賈·斯裏尼瓦桑(srinija srinivasan)回憶道,她當時管理著一個雇有60位年輕編輯和目錄編纂人員的編輯室。114 這種依賴於人工編輯的做法意味著雅虎非常擅長挑選新聞報道。多年以來(甚至直到現在),它在這方麵的能力一直遙遙領先於競爭對手,但是它並不擅長提供搜索工具。然而,斯裏尼瓦桑和她的團隊不可能追趕上網頁數量增長的速度。自動化搜索引擎將會成為萬維網內容查找的主要方式,而這個潮流將由另外兩位斯坦福大學研究生引領。
拉裏·佩奇rry page)生長於一個計算機技術家庭。115 他的父親是密歇根大學的計算機科學和人工智能教授,他的母親也是那裏的編程講師。1979年,也就是在拉裏6歲的時候,他的父親買了一台叫作exidy sorcerer的業餘家用電腦回家。[6] “我還記得家裏剛買電腦的時候,我感到非常興奮,因為這可是一件大事,而且它的價格應該不便宜,就像是買一輛車一樣。”他說道。116 拉裏很快就學會了如何操作這台電腦,他還會用它來做作業。“我想我是小學裏麵第一個用文字處理文檔來交作業的孩子。”117
佩奇的童年偶像之一是尼古拉·特斯拉(nik te),這位充滿想象力的電學先驅擁有大量的發明,但是他在商業上被托馬斯·愛迪生擊敗了,最終在窮困潦倒中逝世。佩奇在12歲的時候讀到了一本特斯拉傳記,他認為這是一個悲哀的故事。“他是曆史上最偉大的發明家之一,但是他的故事實在令人感到痛心。”他說,“他不能將自己的任何發明變成商品,他的資金隻能勉強支撐自己的研究工作。你肯定會更想成為像愛迪生這樣的人。如果你隻是把一件東西發明出來,它不一定能夠為他人帶來幫助。要想真正地把它推廣給全世界,你必須把它生產出來,然後用賺到的錢繼續支持它的研究。”118
拉裏的父母在長途駕車旅行的時候經常會帶上他和他的哥哥卡爾,有時他們會一起參加計算機大會。“我想我在上大學的時候已經差不多去過美國的各個州了。”他說道。有一次,他們駕車前往溫哥華參加國際人工智能聯合大會(international joint conference on artificial intelligence),當時的會場上到處都是各種神奇的機器人。因為拉裏當時還未滿16歲,所以工作人員不允許他進入會場,但是他的父親堅持要帶他進去。“他直接對著他們大吼大叫。這是我為數不多看到他對其他人發脾氣的時候。”119
與史蒂夫·喬布斯和艾倫·凱一樣,拉裏在計算機以外的愛好是音樂。他會吹奏薩克斯,而且學習過作曲。每年暑假他都會到密歇根州北部參加著名的湖心音樂夏令營。這個夏令營采用了一種民主的方式來確定每個孩子的排名:在開營的時候,孩子們會被分配到樂團的各個席位,然後每個孩子都可以挑戰自己前一席位的人。在兩個孩子進行比賽的時候,其他孩子會背對他們聆聽他們演奏同一段音樂,然後投票選出哪一個演奏得更好。“經過一段時間之後,孩子們的排名就會穩定下來,而且每個人都能大概了解自己處於怎樣的水平。”他說道。120
密歇根大學不僅是佩奇的父母任教的地方,也是他們曾經上學和邂逅的地方,所以他們半開玩笑地叫佩奇以後也去那裏上學。而佩奇也確實去上了密歇根大學。他堅持要同時主修商科和計算機科學專業,其中一部分原因是特斯拉的故事給他帶來的啟示——這位大發明家始終無法把自己的發明變成商品。另外一部分原因是比他大9歲的哥哥卡爾起到的榜樣作用,後者在畢業之後成為一家早期社交網絡公司的聯合創始人,這家公司後來以4.13億美元的價格被雅虎收購了。
佩奇提到自己印象最深刻的一門大學課程是朱迪斯·奧爾森(judith olson)教授的人機交互課程。這門課程的目標是理解如何設計簡單而直觀的交互界麵。在這門課程的研究報告中,佩奇選定的主題是eudora郵件客戶端的顯示界麵,他對這個客戶端執行各種操作所需的時長進行了預估和測試。例如,他發現人們使用控製按鍵的操作速度實際上會比鼠標慢0.9秒。“我覺得自己建立了一種理解人們如何與屏幕進行交互的直覺,而且我意識到這些東西是非常重要的,”他說,“然而即使到了今天,這些仍然沒有得到很好的理解。”121
在大學期間的一個暑假裏,佩奇參加了由領導力培訓機構leadershape舉辦的一個集訓活動。該活動旨在鼓勵學生建立一種“積極地忽視不可能”的態度。這家機構反複向他灌輸這樣一個目標,就是發起一些其他人認為是大膽和瘋狂的項目,這也是他日後在穀歌一直追求的目標。在他發起的眾多項目當中,尤其大膽和瘋狂的是他在密歇根大學和後來推動的一些未來主義想法——個人交通係統和無人駕駛汽車。122
在申請研究生院的時候,佩奇被麻省理工學院拒絕了,但是斯坦福大學錄取了他。這其實是一件好事,對於那些有誌於同時涉足技術和商業的人來說,斯坦福大學是一個理想的去處。自從斯坦福畢業生西裏爾·埃爾韋爾(cyril elwell)在1909年創立聯邦電報公司(federal telegraph)以來,技術創業在這裏不僅是一種可以容忍的行為,而且是被廣為接受的。20世紀50年代初,在工程學院院長弗雷德·特曼將大學的部分土地改造成工業園區之後,斯坦福大學鼓勵創業的態度得到了進一步的鞏固。即便是在教員們的眼中,創業計劃的重要性也絲毫不亞於學術論文發表。“這正是我喜歡的那種教授,他們會將一隻腳伸進產業當中,而且希望做出一些顛覆世界的瘋狂事情,”佩奇說道,“斯坦福大學有很多這樣的計算機科學教授。”123
當時大部分的精英大學都將重點放在學術研究上,同時避免涉足商業領域。斯坦福大學率先認識到大學不應該隻是一個學術研究機構,而且可以是一個創業孵化器。由斯坦福大學成功孵化的企業包括惠普、思科、雅虎和太陽計算機係統等。這個列表中最響亮的一個名字最後將由佩奇加上,他認為這種觀點實際上會提升學校的學術研究水平。“我認為純理論方向的研究效率也得到了大大的提升,因為它是建立在現實世界的基礎上的,”他堅持道,“不僅僅是進行理論研究,你也希望自己的研究工作可以應用在實際的問題上。”124
佩奇在1995年秋季正式入讀斯坦福大學研究生院,他在開學之前還參加了一個新生培訓項目,其中有一天的培訓活動設在舊金山進行。當時的領隊是一位善於交際的二年級研究生謝爾蓋·布林(sergey brin)。佩奇是一個天生沉靜的人,但是布林卻是那種能連珠似炮地向他講述自己想法的人,他們很快就進入了關於各種話題的爭論當中,從計算機到城市功能分區無所不談,兩人一拍即合。“我記得自己當時覺得他很討厭,”佩奇承認道,“這種看法一直持續到現在。也許他也是這麽看我的吧。”125 他們確實是一對冤家。“我們都覺得對方很討厭,”布林也坦承,“不過我們隻是開玩笑而已。當然,我們進行了很長時間的交流,所以我們之間肯定有合得來的地方。我們喜歡互相取笑對方。”126
謝爾蓋·布林的父母也是學者,他們都是數學家,但是他的童年跟佩奇的非常不一樣。布林出生於莫斯科,他的父親是莫斯科國立大學的教授,他的母親是蘇聯石油與天然氣研究所的研究工程師。因為他們都是猶太人,所以他們的事業受到了諸多製約。“當時我們的家境貧寒,”謝爾蓋對記者肯·奧萊塔(ken auletta)說道,“我的父母都經曆過非常困難的時期。”當他的父親提交了移民申請之後,他們夫妻兩人同時失業了。他們一家的出境簽證在1979年5月獲批,當時謝爾蓋隻有5歲。在希伯來移民援助協會的幫助下,他們一家住進了一個工薪階層住宅區,他的父親在附近的馬裏蘭大學找到了一份數學教授的工作,他的母親也成為美國國家航空航天局戈達德太空飛行中心(nasa goddard space flight center)的研究員。
謝爾蓋入讀的是一所采用蒙特梭利教育法的學校,他在那裏培養出了獨立思考的能力。“沒有人告訴你應該做什麽,”他說,“你必須規劃好自己的道路。”127 這是他和佩奇之間的一個共同點。在後來被問到擁有身為教授的父母是不是他們取得成功的關鍵時,他們都表示入讀蒙特梭利式教育學校是一個更為重要的因素。佩奇的觀點是:“我認為有一部分原因來自我受到的教育——不要墨守成規,學會自我激勵,用懷疑的眼光看待世界,還有做出與眾不同的事情。”128
布林和佩奇的另外一個共同點是他們在小時候都收到過父母送的電腦,布林在9歲的時候收到了一modore 64電腦作為生日禮物。“當時為自己的電腦編程要比現在容易得多,”他回憶道,“那台電腦內置了一個basic編譯器,[7] 所以我可以馬上開始編寫自己的程序,”在中學時期,布林和一個朋友嚐試編寫一些可以和用戶進行文本對話的程序,希望從中模仿出人工智能。“我認為現在這些接觸電腦的孩子們已經不像我以前那麽容易進入編程的世界了。”129
然而布林對待權威的叛逆態度差點為他惹上大麻煩。在他即將17歲的時候,他的父親帶他回到莫斯科進行參觀。他在莫斯科的路上看到一輛警車,他忍不住朝警車扔了塊石子。車上的兩位警官走下來準備教訓謝爾蓋,幸好他的父母幫他化解了這場危機。“我認為自己的叛逆精神來自我出生於莫斯科這個事實,而這種叛逆精神一直伴隨我到成年之後。”130
物理學家理查德·費曼(richard feynman)的幾本回憶錄讓布林深受啟發,費曼非常推崇將藝術和科學結合在一起的做法,正如列奧納多·達·芬奇那樣。“我記得其中有一部分內容是他講述自己多麽想成為列奧納多——一個集藝術家和科學家於一身的人,”布林說道,“這種想法對我很有啟發,我覺得這是一條通向充實人生的道路。”131
布林分別用三年的時間完成高中和大學本科的學業,他在馬裏蘭大學主修的是數學和計算機科學雙專業。有一陣子,他喜歡和自己的電腦極客朋友們一起在互聯網電子公告欄和聊天室打發時間,不過在發現這些地方充斥著“10歲的男孩們在嚐試談論性愛”之後,他就把注意力轉向了以文本為基礎的多用戶地下城(mud)在線遊戲,他甚至編寫了一個自己的mud遊戲,裏麵有一個運送爆炸物包裹的郵差。“在mud遊戲上花了一些時間之後,我發現這是一個非常酷的東西。”布林回憶道。132 在1993年春天,也就是布林在馬裏蘭大學的最後一年,他下載了安德森剛剛發布的mosaic瀏覽器,緊接著他就被萬維網深深吸引住了。
布林在獲得國家科學基金會的獎學金之後進入了斯坦福大學,他在那裏的研究重點是數據挖掘(同樣,麻省理工學院也拒絕了布林的研究生申請,不過現在看來損失更大的似乎是麻省理工)。在正式入讀博士研究生院之前,布林需要先通過8項綜合性的測試,他在報到之後不久就順利通過了其中7項測試。“我認為自己最擅長的一項測試卻沒有通過,”他回憶道,“於是我去找評分的教授為自己的答案爭辯,並成功說服了他,最終我通過了全部8項測試。”133 這之後他就可以自由選擇喜歡的任何課程,同時沉浸在自己的特殊運動愛好當中——包括雜技、秋千、帆船、體操和遊泳。他可以倒立行走,他還說自己曾經想過要離家出走加入馬戲團。他也是直排輪滑運動的狂熱愛好者,經常有人會看到他在過道之間呼嘯而過。
在佩奇入讀斯坦福大學幾個星期之後,他和布林連同計算機科學係的其他學生都搬進了新建的蓋茨計算機科學大樓。[8] 布林認為建築師製定的辦公室編號方式過於平庸,於是他設計了一種新的編號方式,它能夠更好地表示每個房間的位置和它們之間的距離,這種方式最終得到了采納。“可以說,這個新的編號方式確實非常直觀。”他說道。134 佩奇和另外三位研究生被分配到了一個房間,布林把這裏當成自己的大本營。這個房間裏麵有由電腦控製澆水的懸掛植物、一台連接到電腦的鋼琴、各種各樣的電子玩物,還有為小睡和通宵工作準備的睡墊。
人們用駝峰式拚寫法為這對形影不離的組合取了一個外號——rryandsergey”,他們在進行爭論或者取笑對方的時候就像是兩把互相交鋒的寶劍。他們辦公室裏唯一的女生塔瑪拉·蒙茲納(tamara munzner)稱他們有股“傻傻的聰明”,這點尤其體現在他們為一些荒謬的想法而爭論的時候,比如能否隻以青豆為材料製成樓房大小的建築。“和他們共用一間辦公室是非常有趣的,”她說,“我們在一起的時候都玩得很瘋狂。我記得在一個周六晚上,直到淩晨3點,辦公室裏麵仍然擠滿了人。”135 這對組合不僅以頭腦聰明著稱,在其他人眼中他們還是膽大妄為的。“他們不會假裝尊重權威,”他們的一位導師拉傑夫·莫特瓦尼(rajeev motwani)教授表示,“他們總是質疑我,他們會毫不顧忌地對我說‘你講的東西都是垃圾!’”136
跟其他優秀的創新搭檔一樣,rryandsergey”也有著互補的個性。佩奇不是一個熱衷社交的人,他可以一直盯著電腦屏幕,卻不敢和陌生人進行眼神接觸。他的聲帶因為一次病毒感染而患上了慢性疾病,因此他說話時的嗓音會比較低沉和沙啞,他還有一個令人不快的習慣,就是他有時候會完全陷入沉默(這從很多方麵來看其實是個好習慣),因此他偶爾說出的話語會給人留下更為深刻的印象。佩奇有時會完全沉浸在自己的世界中,但有時也會積極地與人交流。他的笑容往往隻是一閃而過,卻能讓人感受到真摯。他的臉部表情很豐富,他在聆聽別人說話時的專注既讓人感到高興也令人緊張。理性而嚴謹的他可以指出最為常見的論述當中的邏輯問題,也可以輕易地將膚淺的對話轉變為深刻的討論。
而布林有時也會表現得傲慢無禮,但是他的行為卻不會惹人反感。他會未經敲門就闖入其他人的辦公室,不假思索地講出自己的想法和要求,或者隨時加入到任何話題的討論當中。相比之下,佩奇則是一個更為謹言慎行的人。當布林為自己找得某種可行的方法而沾沾自喜的時候,佩奇會深入思考這種方法可行的原因。熱情健談的布林通常都是討論的主導者,而佩奇在討論結束時的低聲評論卻能引人側身傾聽。“也許我要比謝爾蓋更靦腆一些,不過他某些方麵也挺害羞的,”佩奇評論道,“我們有很好的合作關係,我的思維可能會比較廣闊,而且我們掌握的技能也不一樣。我接受的是計算機工程師的訓練,所以我對硬件知識比較在行,但他擁有比我更深厚的數學背景。”137
布林身上有一點讓佩奇感到尤其了不起的是他的聰明才智。“我想說的是,即便是在計算機科學係的學生當中,他也是絕頂聰明的。”除此之外,布林的外向性格也能為他俘獲人心。當佩奇剛剛進入斯坦福大學的時候,他和其他新入學的研究生都被安排在一間被稱為“牛欄”(bullpen)的寬敞房間裏麵。“謝爾蓋非常喜歡交際,”佩奇說道,“他會去結識每一位新生,來熱身區和我們交流。”布林甚至擁有一種和教授交朋友的本領。“謝爾蓋可以走進教授們的辦公室跟他們閑聊,這對於一位研究生來說是比較不尋常的。我想他們容許他這樣做的原因是他是一個非常聰明且博學的學生,他對各種各樣的話題都能提出建設性的想法。”138
佩奇加入了斯坦福大學的人機交互小組,這個團隊的工作是探索改善人機共生關係的方法。人機交互是由利克萊德和恩格爾巴特率先提出的研究領域,同時也是佩奇在密歇根大學最喜歡的課程。他成為以用戶為中心的設計概念的支持者,這種概念強調的是軟件和計算機的界麵必須直觀,而且用戶永遠都是正確的。他在斯坦福大學的論文導師是特裏·威諾格拉德(terry winograd),這位性格開朗的教授留著像愛因斯坦一樣的發型。威諾格拉德之前的研究方向是人工智能,但是在深入思考了人類認知的本質之後,他將自己的研究重點轉向如何利用機器增強和擴展(而不是複製和取代)人類的思想。“我的研究方向從人工智能轉向了一個更加寬泛的問題,‘你想如何與一台計算機進行交互?’”威諾格拉德表示。139
雖然人機交互和界麵設計是利克萊德留下的寶貴財富,但是它在當時仍然被認為是一個相當弱勢的專業,講求實際的計算機科學家們都認為它隻不過是一個由心理學教授任教的科目,而利克萊德和朱迪斯·奧爾森都是心理學教授出身。根據佩奇的說法:“對於研究圖靈機或同類課題的人來說,人類反應的處理是非常情感化的,這種感覺就像是陷入了人文學科的研究當中。”威諾格拉德幫助改善了這個領域的聲譽。“特裏在研究人工智能的過程中建立了過硬的計算機科學背景,但他對人機交互也很感興趣,當時涉足這一領域的人不多,而且我認為它沒有得到足夠的尊重。”用戶界麵設計課程的電影製作課是佩奇最喜歡上的課之一。“它向我證明了電影的語言和技巧確實可以應用於計算機界麵設計。”他說道。140
布林的學術研究重點是數據挖掘。他和莫特瓦尼教授一起成立了一個叫作斯坦福數據挖掘(mining data at stanford,midas)的小組。在他們共同發表的論文當中——該小組的成員還包括另外一位研究生克雷格·希爾弗斯坦(craig silverstein),他後來成為穀歌的第一位員工——有兩篇是關於購物籃分析的。購物籃分析是對顧客購買商品種類的關聯性的分析。141 在這兩篇論文的寫作過程中,布林開始對萬維網數據模式的分析方法產生了興趣。
在威諾格拉德的幫助下,佩奇開始思考自己的博士論文題目。他考慮了超過10個題目,其中有一個是關於如何設計自動駕駛汽車的,這是穀歌之後會研究的一個項目。他最終選定了一個自己比較熟悉的題目——如何評估不同網站之間的相對重要性。他采用的研究方法來自他所處的家庭學術環境。如果要知道一篇學術論文的價值,其中一個判斷標準是它在其他論文的注解和參考文獻部分被引用的次數。按照同樣的理論,如果要判斷某個網頁的價值,其中一種方法是了解鏈接到該網頁的其他網頁的數量。
但是這種方法存在一個問題。蒂姆·伯納斯–李在設計萬維網的時候,他的理念是任何人都可以在未經允許的情況下建立指向其他網頁的鏈接,將網頁鏈接保存在數據庫中,或者雙向使用鏈接。不過這正是包括泰德·尼爾森在內的超文本純粹主義者所擔心的做法。雖然這個理念讓萬維網得以迅速擴張,但是這也意味著人們將無法輕易得知指向某個網頁的鏈接數量或者來源。你可以在一個網頁上看到所有向外的鏈接,但你不能看到指向這個網頁的鏈接的數量和質量。“在我見過的協作係統當中,萬維網的協作功能是相對較弱的,因為它的超文本存在一個缺陷:它沒有雙向鏈接。”佩奇說道。142
於是佩奇開始嚐試建立一個含有大量鏈接的數據庫,這樣他就可以反向追蹤這些鏈接,找出每個網頁的鏈接會通向什麽網站。這項工作的其中一個目的是促進協作。他打算讓人們在自己的網頁上為其他網頁添加注釋,如果哈利將自己的評論鏈接到了薩莉的網站,那麽正在瀏覽這個網站的人就可以前往查看哈利的評論。“在實現了反向鏈接追蹤之後,人們隻需鏈接到某個網站就可以對其進行評論或者注釋。”佩奇解釋道。143
佩奇用於實現反向鏈接的方式來自一個大膽的想法——這是他在一天半夜醒來之後突然想到的。“我當時在想:如果我們可以把整個萬維網下載下來,然後隻將其中的鏈接保存下來,那會怎樣呢?”他回憶道,“我馬上拿起了一支筆,記下自己的想法。整個後半夜我都在完善這個想法的細節,並說服自己這是可行的。”144 這次的半夜工作經曆給他上了一課。“你必須給自己定下不太可能實現的目標,”他後來對一群以色列學生說道,“我在大學期間學到了一句話:‘積極地忽視不可能。’這句話說得非常好。你們應該嚐試一些大多數人都不敢做的事情。”145
要把整個萬維網記錄下來可不是一件易事。即使是在1996年1月的時候,全世界已經有10萬個網站,這些網站總共含有1 000萬個文檔,它們之間的鏈接有近10億條,而且這些數字每年都會呈現指數級增長。在當年初夏,佩奇設計了一個網絡爬蟲工具,它會從佩奇的個人主頁出發,一直跟蹤它遇到的所有鏈接。這隻在萬維網上迅速移動的蜘蛛會保存每條超鏈接的文本和來源,以及它們對應網頁的標題。他將這個項目命名為“backrub”。
佩奇向自己的導師威諾格拉德表示,他粗略估計自己的網絡爬蟲將會在幾個星期之內完成這項任務。“特裏故意點了點頭,他明明知道這需要花費比我想象中長得多的時間,但是他明智地向我隱瞞了這點;”佩奇回憶道,“人們經常會低估年輕人的樂觀精神!”146 這個項目很快就占用了斯坦福大學幾乎一半的互聯網帶寬,而且它至少造成了一次全校範圍內的網絡中斷,但是學校的行政人員仍然對此保持比較寬容的態度。“我的磁盤空間幾乎已經用完了。”佩奇在1996年7月15日向威諾格拉德發了一封郵件,他當時已經收集了2 400萬條網址和超過1億條鏈接。“雖然我當時隻保存了大概15%的網頁,不過情況看起來非常樂觀。”147
佩奇這個大膽而複雜的項目吸引了擁有數學頭腦的謝爾蓋·布林的注意,後者當時正在尋找一個合適的博士論文題目。他興致勃勃地加入了自己好友的工作當中:“這是最令人興奮的一個項目,不僅因為它與代表人類知識的萬維網相關,也因為我喜歡拉裏這個人。”148
backrub項目在當時的目標仍然是收集萬維網的反向鏈接,為將來可能實現的注釋係統和引用分析功能打下基礎。“現在想來不可思議的是,我當時完全沒有想過要建立一個搜索引擎。”佩奇說道,“這個想法甚至不在我們的考慮範圍之內。”隨著這個項目的逐步推進,他和布林想出了一些更為複雜的網頁價值分析方法,這些方法采用的依據是指向每個網頁的鏈接的數量和質量。這時候,他們逐漸認識到這個按照重要性排名的網頁索引可以成為一個高質量搜索引擎的基礎。這就是穀歌誕生的由來。“當一個偉大的夢想出現的時候,”佩奇後來說道,“你要馬上抓住它!”149
這個經過改進的項目最初被稱為“pagerank”,因為它會對backrub索引收集到的每個網頁進行排名。當然,這個名字還體現了佩奇的諷刺幽默感和小小的虛榮心。“不好意思,它確實是指我自己。”他後來羞怯地承認道,“我其實對此感到有點難為情。”150
網頁排名的目標還會引出另外一個複雜的問題。佩奇和布林意識到除了對指向網頁的鏈接數量進行匯總以外,他們還可以嚐試確定每條進入鏈接的價值。例如,來自《紐約時報》的鏈接應該要比賈斯汀·霍爾在斯沃斯摩爾學院宿舍發出的鏈接有更高的價值。這樣就建立了一個由多個反饋循環形成的遞歸過程:每個頁麵的排名依據是進入鏈接的數量和質量,而這些鏈接的質量是由生成它們的頁麵的數量和質量來決定的,以此類推。“整個過程都是遞歸的,”佩奇解釋道,“這是一個巨大的循環。不過數學的力量是很強大的,它可以幫助我們解決這個問題。”151
布林能夠充分理解這種類型的數學難題。“事實上我們想出了很多數學方法來解決這個問題,”他回憶道,“我們將整個萬維網轉換成一組含有數億個變量的龐大方程,這些變量就是所有網頁的排名。”152 在各自導師的指導之下,他們為此合著了一篇論文。他們在其中清晰地講述了這些複雜數學公式的基礎——網頁含有的進入鏈接數量以及每條鏈接的相對排名。然後他們用外行人都能明白的簡單語言解釋道:“如果一個網頁的反向鏈接的整體排名越高,那麽這個網頁本身的排名就越高。這裏同時考慮到了頁麵擁有大量反向鏈接和少量高排名鏈接的情況。”153
那麽pagerank真的可以生成更好的搜索結果嗎?這是一個價值10億美元的問題。他們為此進行了一項對比測試。他們用到的測試關鍵詞之一是“大學”(university)。如果在altavista和其他引擎搜索這個關鍵詞,它們會列出在標題中含有該關鍵詞的隨機頁麵。“我記得自己曾經問過他們,‘為什麽你們要提供這樣的垃圾結果?’”佩奇說道。對方給出的回應是,沒有得到合適的搜索結果是佩奇的問題,他應該改善自己使用的搜索關鍵詞。“我在人機交互的課程上學習到抱怨用戶並非一個好的策略,所以我知道他們根本就沒有把事情做好。‘用戶永遠是對的’這一觀念讓我們可以做出一個更好的搜索引擎。”154 在pagerank中,以“大學”為關鍵詞的最優先搜索結果分別為斯坦福大學、哈佛大學、麻省理工學院和密歇根大學,他們對這個結果感到十分滿意。“哇噢!”佩奇記得自己當時發出了這樣的讚歎,“我和小組的其他成員都清楚地認識到,如果我們在為網頁進行排名的時候能夠參考外界對這個網頁的看法,而不是僅僅關注網頁本身,這將會對網頁搜索帶來很大的幫助。”155
為了繼續完善pagerank的搜索結果,佩奇和布林加入了更多的參考因素,例如關鍵字在網頁上出現的頻率、字號和位置。如果關鍵字出現在網址中,使用了大寫形式,或者包含在標題內,對應的網頁就會得到更高的排名。他們會對比采用不同參數組合的搜索結果,然後不斷調整和改進算法。他們發現應該對錨文本給予較高的權重,錨文本指的是作為超鏈接的下劃線文本。例如,“比爾·克林頓”是許多指向美國白宮網站(whitehouse.gov)的鏈接的錨文本,因此當用戶搜索“比爾·克林頓”的時候,白宮網站應該出現在最優先的搜索結果,盡管這個網站的主頁中沒有明顯地出現比爾·克林頓這個名字。相比之下,用戶在另外一個競品上搜索“比爾·克林頓”的時候,得到的第一條搜索結果是“今日的比爾·克林頓笑話”。156
由於這個搜索引擎需要處理海量的頁麵和鏈接,所以佩奇和布林把它命名為穀歌(google),這個名字來源於古戈爾(googol)——是指1後有100個0。提出這個名字的人是他們辦公室的另外一位研究生肖恩·安德森(sean anderson)。他們在瀏覽器中輸入“google”,發現這個域名仍然可用,於是佩奇把它搶注了下來。“我不確定我們是否意識到自己犯了一個拚寫錯誤,”布林後來說道,“不過‘googol’域名已經被占用了。之前已經有人注冊了‘googol’,我試過向那個人提出購買域名的請求,但是對方非常喜歡這個域名,所以不願意出售。因此我們還是選擇了‘google’。”157 這是一個很好玩的單詞——簡單易記,輸入方便,還可以轉換成動詞來使用。[9]
佩奇和布林從兩個方麵繼續改進穀歌的使用體驗。首先,他們建立了比任何競爭對手都高出許多的網絡帶寬、處理能力和儲存容量,從而將他們的網絡爬蟲的處理速度提升至每秒索引100個網頁。除此之外,他們還非常熱衷於研究用戶行為,這點有助於持續改進他們的算法。如果用戶在點擊了最優先的搜索結果之後沒有返回搜索結果列表,這就意味著他們已經找到了自己想要的東西。但是如果他們在完成搜索之後立刻修改自己的關鍵詞,就說明他們對搜索結果不滿意,這時候工程師們就需要查看用戶修改過的搜索關鍵詞,從而了解他們最初想要查找的東西。用戶每次跳轉到第二頁或第三頁搜索結果的時候都表明他們對搜索結果的排序不滿意。按照記者史蒂文·利維的說法,這個反饋循環可以幫助穀歌學習到用戶的真正意圖,當用戶輸入“狗”(dogs)的時候,他們可能也想查找小狗(puppies);他們在輸入“沸騰”(boiling)的時候可能是指熱水(hot water)。當然,穀歌也學會了用戶在輸入“熱狗”(hot dog)的時候並不是想查找“沸騰的小狗”(boiling puppies)。158
還有另外一個人也想到了跟pagerank非常相似的基於鏈接的網頁排名機製:一位來自中國的計算機工程師李彥宏。他曾經在紐約州立大學水牛城分校學習,在碩士畢業後,他開始為道瓊斯公司位於新澤西州的一家子公司工作。1996春天,也就是佩奇和布林正在啟動pagerank項目的時候,李彥宏想出了一個叫作“rankdex”的算法,它可以根據進入網頁鏈接的數量和鏈接錨文本的內容確定搜索結果的權重。他買了一本書自學如何為這個想法申請專利,並在道瓊斯公司的幫助下完成了專利的申請。但是道瓊斯公司沒有繼續推進這個想法,於是李彥宏加入了位於矽穀的infoseek公司,後來返回中國。他在回國之後和其他人共同創立了百度,成為中國最大的搜索引擎,而且是穀歌在全球範圍內最有實力的競爭對手之一。
到了1998年年初,佩奇和布林的數據庫已經收錄了5.18億條超鏈接,而當時萬維網的鏈接總數約為30億條。佩奇不希望穀歌僅僅停留在學術項目的層麵,他想盡快把它打造成為一款熱門產品。“這就像是尼古拉·特斯拉麵臨的問題,”他說,“如果你有一個自認為不錯的發明,你會想讓它盡快被多數人用上。”159
因為佩奇和布林想將自己的博士論文付諸實踐變成一家公司,所以他們不願意對已有的工作成果進行發表或者正式展示。但是他們的導師卻一直催促他們發表一些東西出來,於是他們在1998年春天完成了一篇20頁的論文,他們在其中解釋了pagerank和穀歌背後的學術理論,但是沒有向競爭對手透露過多的商業機密。1998年4月,這篇題為《一個大規模超文本萬維網搜索引擎的剖析》的論文發表於一場在澳大利亞舉行的計算機大會上。
“我們會在本論文中介紹穀歌,一個倚重於超文本架構的大規模搜索引擎的原型。”他們在論文的開頭寫道。160 在收集了萬維網上總共30億條鏈接當中的大約5億條之後,他們能夠計算出至少2 500萬個網頁的排名,這點“相當符合人們對重要性的排名需求”。他們詳細講述了產生每個網頁的排名的“簡單迭代算法”。“學術參考文獻的引用方式已經被應用到萬維網之上,主要的方法是計算指向給定網頁的引用或反向鏈接數量。pagerank進一步拓展了這個概念,它不會為來自所有網頁的鏈接給予同等的權重。”
這篇論文含有大量關於排名、爬蟲、索引和迭代算法的技術細節,還有一部分內容講述了一些在未來有價值的研究方向。不過論文的結尾明確指出了這個項目不是一次學術實踐或者研究工作,他們進行這項工作的目標顯然是成立一家商業公司。“穀歌的設計目的是成為一個可擴展的搜索引擎,”他們在論文的結論中宣稱,“我們的首要目標是提供高質量的搜索結果。”
如果是在那些主要以學術為目的而進行研究的大學裏麵,他們的做法也許是有問題的。但是斯坦福大學不僅允許學生參與商業項目,而且還會為他們提供鼓勵和幫助。學院甚至還有專門幫助學生完成專利申請和授權事宜的辦公室。“我們斯坦福大學擁有促進創業精神和冒險研究的環境,”校長約翰·亨尼斯(john hennessey)強調,“這裏的人們深刻地理解到一點——有時候改變世界的最佳方式不是寫論文,而是將你相信可行的技術變成真正的產品。”161
佩奇和布林嚐試商業化的第一步是向其他公司授權使用他們的軟件,他們會見了雅虎、excite和altavista等公司的首席執行官。這些公司的出價是100萬美元,不過這也不算是一個天文數字,因為除了專利授權的費用以外,這筆資金還包含了他們兩人提供服務的酬勞。“當時這些企業的市值已經達到數億美元甚至更高,”佩奇後來說道,“所以這對於他們來說隻是一個小數目。但是他們的領導層缺乏足夠的遠見,他們有很多人都跟我們說:‘搜索其實沒有那麽重要。’”162
於是佩奇和布林決定成立他們自己的公司。他們所在的地理位置是一個適合創業的地方,在距離斯坦福校園幾英裏之外就有一些願意成為天使投資人的成功企業家,而且不遠的沙丘路上都是雄心勃勃的風險投資人,他們都可以為創業公司提供啟動資金。斯坦福大學有一位叫戴維·切裏頓(david cheriton)的教授,他曾經和安迪·貝希托爾斯海姆(andy bechtolsheim)共同創辦過一家銷售以太網產品的公司,這家公司後來被思科係統公司收購了。1998年8月,切裏頓建議佩奇和布林與貝希托爾斯海姆進行一次會麵,後者還是太陽計算機係統公司的聯合創始人之一。在一天深夜,布林向貝希托爾斯海姆發了一封郵件,對方立刻回複了布林。第二天早上,他們齊聚在位於帕洛阿爾托的切裏頓家中會麵。
即便是在青澀的學生時代,佩奇和布林也能為他們的搜索引擎做出激動人心的演示。他們展示了自己可以在一組小型計算機上對萬維網的大部分內容進行下載、索引和網頁排名的操作。這是在互聯網泡沫最大的時期進行的一次愉快會麵,貝希托爾斯海姆在會議上提出的問題也很有啟發性。他每個星期都會聽到很多場融資演講,但是他知道這跟那些根本不存在的霧件(vaporware)[10] 的幻燈片展示不一樣,他可以親手輸入搜索關鍵字,然後馬上就可以看到一些比altavista優秀得多的搜索結果。另外,兩位創始人都非常聰明且充滿幹勁,他就喜歡在這種類型的創業者身上押賭注。貝希托爾斯海姆很欣賞他們不打算在市場營銷方麵花費太多資金的想法(或者說他們實在不想在這方麵花費任何資金)。他們知道穀歌是一個足夠優秀的產品,它可以通過用戶之間的口碑來傳播,所以他們籌集到的每一分錢都會花在組裝服務器所需的零件上。“其他網站都會將很大一部分的風險資金花在廣告上麵,”貝希托爾斯海姆說道,“他們卻反其道而行之——先做出一些有價值的東西,推出一項足以吸引用戶使用的服務。”163
雖然布林和佩奇都不太願意接受廣告,但是貝希托爾斯海姆知道在搜索結果頁麵加入一些清晰標注的廣告是很容易做到的,而且不會影響用戶體驗。這就意味著他們已經擁有了一個等待挖掘的巨大收入來源。貝希托爾斯海姆對他們說道:“這是我在近年來聽到過的最棒的想法。”然後他們談到了具體的投資金額,貝希托爾斯海姆說他們的開價太低了。“好吧,我也不想浪費時間,”貝希托爾斯海姆最後說道,還有很多工作等著他去做,“我給你們寫一張支票,我想它肯定可以幫到你們。”他從自己的車上拿出了一個支票本,然後向穀歌公司開出了一張10萬美元的支票。“我們現在還沒有銀行賬戶呢。”布林告訴他。“那等你們開了賬戶之後再存進去把。”貝希托爾斯海姆回應道,之後就開著自己的保時捷跑車絕塵而去。
布林和佩奇一起去了漢堡王餐廳慶祝。“我們覺得應該吃一些好吃的東西,盡管那些食物確實很不健康,”佩奇說道,“而且價格也很便宜。對於這次的成功融資來說,這似乎也是一種合適的慶祝方式。”164
貝希托爾斯海姆開給“穀歌公司”的那張支票讓他們有動力開始組建一家公司。“我們必須盡快找到一位律師。”布林如是說。165 佩奇回憶道:“當時的感覺就像是,哇噢!也許我們真的要馬上開一家公司了。”166 由於貝希托爾斯海姆的聲譽(以及穀歌的產品本身足夠優秀),這個項目也吸引了其他投資人的加入,其中包括亞馬遜網站的傑夫·貝佐斯。“我真的愛上了拉裏和謝爾蓋,”貝佐斯表示,“他們具有以用戶為中心的遠見。”167 穀歌的名聲在人們的交口稱讚當中變得越來越響亮,以至於在幾個月之後,位於矽穀的兩家頂尖風險投資公司——紅杉資本和凱鵬華盈都對它進行了投資,很少有創業公司可以同時得到這兩家競爭對手的青睞。
除了樂於幫助學生的大學、熱心的導師和風險投資人以外,矽穀還有另外一個特色:這裏有許多車庫,而休利特和帕卡德設計他們第一款產品的地方,以及喬布斯和沃茲尼亞克組裝出第一塊apple i電腦主板的地方——正是在這樣的車庫裏。一心準備創業的佩奇和布林決定擱置他們的論文計劃並離開斯坦福大學的象牙塔,這時候他們找到了一個可以作為落腳點的車庫。他們在就讀斯坦福大學期間認識了一位名叫蘇珊·沃西基(susan wojcicki)的朋友(她在不久後也成為穀歌的員工),她家就住在學校附近的門洛帕克,於是他們以每月1 700美元的租金租下了她家的雙車位車庫,連同一個浴缸和幾間空置的房間。1998年9月,也就是在和貝希托爾斯海姆見麵的一個月之後,佩奇和布林開設了一個銀行賬戶,把那張支票兌現了。他們在車庫的牆上掛了一塊白板,上麵寫著“穀歌全球總部”。
除了將整個萬維網的信息囊括其中以外,穀歌還代表了人機關係領域的一項重大飛躍,也就是利克萊德在40年前構想的“人機共生關係”。雅虎之前嚐試通過結合自動搜索和人工編纂目錄的方法實現一種初級形式的人機共生關係。乍看之下,佩奇和布林所使用的方法是將人工的操作排除在外,完全使用網絡爬蟲和計算機算法來進行搜索。但是如果對其進行深入思考的話,我們會發現,他們的方法實際上是機器和人類智慧的結合。他們的算法依賴於人們在自己的網站上創建鏈接時做出的數十億次判斷。這是一種自動利用人類智慧的方式,換句話說,這是一種更高層次的人機共生關係。“這個過程看起來似乎是完全自動化的,”布林解釋道,“但事實上最終的成果是由數百萬人共同打造出來的,他們花了大量的時間在設計網頁和確定鏈接來源上,這就是它背後的人為因素。”168
在那篇發表於1945年的著名文章《誠如所思》之中,萬尼瓦爾·布什提出了一項艱巨的任務:“人類的經驗總和正以驚人的速度增長,但是我們從隨之而來的知識迷宮中獲取重要信息的方法卻與大航海時代別無二致。”布林和佩奇在離校創業之前提交的那篇論文中也提到了同樣的觀點:“索引中的文檔數量已經出現了多個數量級的增長,但是用戶查找文檔的能力卻沒有隨之提升。”雖然他們的文采不如布什,但是他們已經成功實現了他的夢想——通過人機協作來應對信息過載。穀歌也由此創造了一個人類、計算機和網絡緊密鏈接的世界,而實現這一成就用了60年的時間。任何人都可以向世界各地的人們分享任何信息,就像是那本來自維多利亞時代的年鑒所承諾的一樣——“包羅萬象”。
[1] 與萬維網的http協議類似,gopher是一個互聯網(tcp/ip)應用層協議。它主要利用基於菜單的導航來實現在線查找和分發文檔(通常是文字文檔)。它的鏈接是在服務器端處理的,而不是內嵌到文檔當中。它的名字取自明尼蘇達大學的吉祥物,另外它也是“go for”(努力爭取)的諧音。
[2] 一年後,安德森與一位成功的連續創業家吉姆·克拉克(jim rk)共同成立了一家叫作網景scape)的公司,這家公司的產品是一款商用版本的mosaic瀏覽器。
[3] 比特幣和其他加密貨幣都是通過結合數字加密技術和密碼學原理創造的去中心化控製的安全貨幣。
[4] 牛津英語詞典在2003年3月將“blog”作為名詞和動詞收錄在內。
[5] 值得注意和表揚的是,維基百科上關於自身發展曆史,以及威爾士和桑格起到的真正作用的條目(在討論版中經過了激烈的爭論之後)是公正客觀的。
[6] 這款電腦的設計者是比特商店(byte shop)的老板保羅·特雷爾(paul terrell),他曾經為自己的商店訂購了世界上前50台apple i電腦。
[7] 這是比爾·蓋茨編寫的編譯器。
[8] 蓋茨分別為哈佛大學、斯坦福大學、麻省理工學院和卡內基梅隆大學捐建了一座計算機大樓。其中位於哈佛大學的馬克斯韋爾–德沃金(maxwell dworkin)大樓是由他和史蒂夫·鮑爾默共同捐建的,該大樓的名字取自他們兩位的母親。
[9] 牛津英語詞典在2006年將“google”作為動詞收錄在內。
[10] 霧件是指在互聯網行業,在未開發完成前就開始做宣傳的某項產品或技術,但最後它們可能並不會問世。——編者注