這裏我們假設這種技術能夠持續進步,未來基於大數據和機器學習基礎上的人工智能達到比較流暢地模擬人類對話,就是人類可以和機器進行比較自如的對話。
事實上,ibm的“沃森”計劃就是這樣科技工程,比如試圖讓計算機當醫生,能夠對大部分病進行診斷,並和病人進行溝通。另外,也假設目前剛剛興起的穿戴式計算設備取得巨大的進展。這種進展到什麽程度呢?就是你家的寵物小狗身上也裝上了各種傳感器和穿戴式設備,比如有圖像采集,有聲音采集,有嗅覺采集,有對小狗的健康進行監控的小型醫療設備,甚至還有電子藥丸在小狗的胃中進行消化情況監控。小狗當然也聯上網,也一樣產生了巨大的數據量。這時,我們假設基於這些大數據建模,能夠模擬小狗的喜怒哀樂,然後還能夠通過擬人化的處理進行語音表達,換句話說,就是模擬小狗說人話,比如主人回家時,小狗搖尾巴,旺旺叫,那麽這個附著於小狗身上的人工智能係統就會說,“主人,真高興看到你回家”。不僅如此,你還可以和小狗的人工智能係統進行對話,因為這個人工智能係統能基本理解你的意思,又能夠代替小狗擬人化表達。以下我們模擬一下可能的對話:
你:“小狗,今天過得好?”
小狗:“不錯啊,主人你今天換的新狗糧味道很好,總覺得沒有吃夠。”
你:“那很好。我們以後繼續買這種狗糧。對了,今天有什麽人來嗎?”
小狗:“隻有郵遞員來投遞報紙。另外,鄰居家的小狗瑪麗也來串門,我們一起玩了一下午。”
你:“那你們玩的怎麽樣?”
小狗:“很開心啊。我好像又進入了初戀呢。”
我們可以把上麵的模擬對話當成一個笑話。但其實,我們這個時候就會發現一個驚人的事實,就是你其實是麵對了兩隻小狗,一隻是物理意義上的小狗,一隻是基於大數據和機器學習的人工智能虛擬小狗,而且虛擬小狗比物理小狗還要聰明,真正善解人意。那麽,這個虛擬小狗是不是新的智慧生物呢?
我們繼續把這個故事來做延伸,把小狗換成未來的人,人在一生中產生大量的數據,根據這些數據建模可以直接推演出很多的結論,比如喜歡看什麽樣的電影啊,喜歡什麽口味的菜啊,在遇到什麽問題時會怎麽采取什麽行動啊。
這樣的數據一直累積下來,直到這個人去世。
我們有個大膽的想象,這些巨大的數據能否讓這個人以某種方式繼續存在下去呢?後代有什麽問題需要尋求答案的時候,比如在人生的關鍵抉擇時,比如大學要上什麽專業、該不該和某個姑娘結婚,可不可以問問這個虛擬的人(祖先)有什麽建議呢?答案是當然可以。在這種情況下,數字化生存不僅在人生前存在,也可以在人死後繼續存在。人死了,可以在虛擬空間中繼續存在。一輩子、一輩子的人故去,這些虛擬的智慧都可以繼續存在,假設很多年過去了,這些虛擬智慧的祖宗們太多太多了,活著的子孫們甚至可以組建一個“祖宗聯席參謀委員會”,優選那些考得好的(比如中過狀元),當過國家高級公務員(比如太守)、當過企業高管(比如ceo)、當過教授、當過作家的等等當過成功人士的祖宗,專門用於後代的谘詢、解惑。讓這些祖宗死後還有競爭,別死了就沒有事情幹了。這個場景是不是很熟悉啊?就是迪斯尼動畫片《花木蘭》中出現過的場景啊,花木蘭在麵臨是否代父參軍的重大人生時刻,就向“祖宗聯席參謀委員會”傾訴過困惑,得到了指點。
再更大膽地想象一下,假設材料科學也取得巨大的進展,那我們能不能把這些虛擬的生命重新植入到模擬人類的生態體上呢?當然也可以。這個新智慧體可非常像真正的人啊。那這算不算人死後複生呢?那這個新智慧體能不能繼續擁有以前的身份證呢?能不能繼續擁有以前的財產呢?能不能繼續享受養老金呢?是不是也要有強製規定一定的壽命限製呢?這種智慧體會不會自學習、自進化?他們會不會爆發和人類的戰爭?往深處多想想,感覺全亂套了,現在的倫理、法律等都麵臨巨大的挑戰。
這些說明什麽呢?就是隨著大數據和機器學習的進一步進展,這個世界出現了新的智慧生物!大數據和機器學習在改變、重構和顛覆很多企業、行業和國家以後,終於到了改變人類自身的時候了!人類的演進出現了新的分支!
當時人工智能就是模擬人的智能思考方式來構築機器智能。以機器翻譯來說,語言學家和語言專家必須不辭勞苦地編撰大型詞典和與語法、句法、語義學有關的規則,數十萬詞匯構成詞庫,語法規則高達數萬條,考慮各種情景、各種語境,模擬人類翻譯,計算機專家再構建複雜的程序。最後發現人類語言實在是太複雜了,窮舉式的做法根本達不到最基本的翻譯質量。這條道路最後的結果是,1960年代後人工智能的技術研發停滯不前數年後,科學家痛苦地發現以“模擬人腦”、“重建人腦”的方式來定義人工智能走入一條死胡同,這導致後來幾乎所有的人工智能項目都進入了冷宮。
這裏講個小插曲。我讀大學的時候,有個老師是國內人工智能的頂級教授,還是國內某個人工智能研究會的副會長。他評述當時的人工智能,不是人工智能,而是人工愚蠢,把人類簡單的行為分解、分解再分解,再去笨拙地模擬,不是人怎麽聰明怎麽學,而是模擬學習最蠢的人的最簡單的動作。他說,對於當時人工智能的進步,有些人沾沾自喜,說好像登月計劃中人類離月亮更進一步了,其實,就是站上了一塊石頭對著月亮抒情,啊,我離你更近了。他對自己事業的自我嘲諷,讓我至今記憶非常深刻。
後來有人就想,機器為什麽要向人學習邏輯呢,又難學又學不好,機器本身最強大的是計算能力和數據處理能力,為什麽不揚長避短、另走一條道路呢?這條道路就是ibm“深藍”走過的道路。1997年5月11日,國際象棋大師卡斯帕羅夫在和ibm公司開發的計算機“深藍”進行對弈時宣布失敗,計算機“深藍”因此贏得了這場意義深遠的“人機對抗”。“深藍”不是靠邏輯、不靠所謂的人工智能取勝的,就是靠超強的計算能力取勝:思考不過你,但是算死你。
類似的邏輯在後續也用到了機器翻譯上。穀歌、微軟和ibm都走上了這條道路。就是主要采用匹配法,同時結合機器學習,依賴於海量的數據及其相關相關統計信息,不管語法和規則,將原文與互聯網上的翻譯數據對比,找到最相近、引用最頻繁的翻譯結果做為輸出。也就是利用大數據以及機器學習技術來實現機器翻譯。現有的數據量越是龐大,那麽這個係統就能越好地運行,這也正是為何新的機器翻譯隻有在互聯網出現以後才有可能重新取得突破性進展的原因所在。
因此,目前這些公司機器翻譯團隊中,有不少計算機科學家,但卻連一個純粹的語言學家也沒有,隻要擅長數學和統計學,然後又會編程,那就可以了。
總而言之,利用這種技術,計算機教會自己從大數據中建立模式。有了足夠大的信息量,你就能讓機器學會做看上去有智能的事情,別管是導航、理解話語、翻譯語言,還是識別人臉,或者模擬人類對話。英國劍橋微軟研究院的克裏斯·畢肖普(chrisbishop)打了個比方:“你堆積足夠多的磚塊,然後退上幾步,就能看到一座房子。”
事實上,ibm的“沃森”計劃就是這樣科技工程,比如試圖讓計算機當醫生,能夠對大部分病進行診斷,並和病人進行溝通。另外,也假設目前剛剛興起的穿戴式計算設備取得巨大的進展。這種進展到什麽程度呢?就是你家的寵物小狗身上也裝上了各種傳感器和穿戴式設備,比如有圖像采集,有聲音采集,有嗅覺采集,有對小狗的健康進行監控的小型醫療設備,甚至還有電子藥丸在小狗的胃中進行消化情況監控。小狗當然也聯上網,也一樣產生了巨大的數據量。這時,我們假設基於這些大數據建模,能夠模擬小狗的喜怒哀樂,然後還能夠通過擬人化的處理進行語音表達,換句話說,就是模擬小狗說人話,比如主人回家時,小狗搖尾巴,旺旺叫,那麽這個附著於小狗身上的人工智能係統就會說,“主人,真高興看到你回家”。不僅如此,你還可以和小狗的人工智能係統進行對話,因為這個人工智能係統能基本理解你的意思,又能夠代替小狗擬人化表達。以下我們模擬一下可能的對話:
你:“小狗,今天過得好?”
小狗:“不錯啊,主人你今天換的新狗糧味道很好,總覺得沒有吃夠。”
你:“那很好。我們以後繼續買這種狗糧。對了,今天有什麽人來嗎?”
小狗:“隻有郵遞員來投遞報紙。另外,鄰居家的小狗瑪麗也來串門,我們一起玩了一下午。”
你:“那你們玩的怎麽樣?”
小狗:“很開心啊。我好像又進入了初戀呢。”
我們可以把上麵的模擬對話當成一個笑話。但其實,我們這個時候就會發現一個驚人的事實,就是你其實是麵對了兩隻小狗,一隻是物理意義上的小狗,一隻是基於大數據和機器學習的人工智能虛擬小狗,而且虛擬小狗比物理小狗還要聰明,真正善解人意。那麽,這個虛擬小狗是不是新的智慧生物呢?
我們繼續把這個故事來做延伸,把小狗換成未來的人,人在一生中產生大量的數據,根據這些數據建模可以直接推演出很多的結論,比如喜歡看什麽樣的電影啊,喜歡什麽口味的菜啊,在遇到什麽問題時會怎麽采取什麽行動啊。
這樣的數據一直累積下來,直到這個人去世。
我們有個大膽的想象,這些巨大的數據能否讓這個人以某種方式繼續存在下去呢?後代有什麽問題需要尋求答案的時候,比如在人生的關鍵抉擇時,比如大學要上什麽專業、該不該和某個姑娘結婚,可不可以問問這個虛擬的人(祖先)有什麽建議呢?答案是當然可以。在這種情況下,數字化生存不僅在人生前存在,也可以在人死後繼續存在。人死了,可以在虛擬空間中繼續存在。一輩子、一輩子的人故去,這些虛擬的智慧都可以繼續存在,假設很多年過去了,這些虛擬智慧的祖宗們太多太多了,活著的子孫們甚至可以組建一個“祖宗聯席參謀委員會”,優選那些考得好的(比如中過狀元),當過國家高級公務員(比如太守)、當過企業高管(比如ceo)、當過教授、當過作家的等等當過成功人士的祖宗,專門用於後代的谘詢、解惑。讓這些祖宗死後還有競爭,別死了就沒有事情幹了。這個場景是不是很熟悉啊?就是迪斯尼動畫片《花木蘭》中出現過的場景啊,花木蘭在麵臨是否代父參軍的重大人生時刻,就向“祖宗聯席參謀委員會”傾訴過困惑,得到了指點。
再更大膽地想象一下,假設材料科學也取得巨大的進展,那我們能不能把這些虛擬的生命重新植入到模擬人類的生態體上呢?當然也可以。這個新智慧體可非常像真正的人啊。那這算不算人死後複生呢?那這個新智慧體能不能繼續擁有以前的身份證呢?能不能繼續擁有以前的財產呢?能不能繼續享受養老金呢?是不是也要有強製規定一定的壽命限製呢?這種智慧體會不會自學習、自進化?他們會不會爆發和人類的戰爭?往深處多想想,感覺全亂套了,現在的倫理、法律等都麵臨巨大的挑戰。
這些說明什麽呢?就是隨著大數據和機器學習的進一步進展,這個世界出現了新的智慧生物!大數據和機器學習在改變、重構和顛覆很多企業、行業和國家以後,終於到了改變人類自身的時候了!人類的演進出現了新的分支!
當時人工智能就是模擬人的智能思考方式來構築機器智能。以機器翻譯來說,語言學家和語言專家必須不辭勞苦地編撰大型詞典和與語法、句法、語義學有關的規則,數十萬詞匯構成詞庫,語法規則高達數萬條,考慮各種情景、各種語境,模擬人類翻譯,計算機專家再構建複雜的程序。最後發現人類語言實在是太複雜了,窮舉式的做法根本達不到最基本的翻譯質量。這條道路最後的結果是,1960年代後人工智能的技術研發停滯不前數年後,科學家痛苦地發現以“模擬人腦”、“重建人腦”的方式來定義人工智能走入一條死胡同,這導致後來幾乎所有的人工智能項目都進入了冷宮。
這裏講個小插曲。我讀大學的時候,有個老師是國內人工智能的頂級教授,還是國內某個人工智能研究會的副會長。他評述當時的人工智能,不是人工智能,而是人工愚蠢,把人類簡單的行為分解、分解再分解,再去笨拙地模擬,不是人怎麽聰明怎麽學,而是模擬學習最蠢的人的最簡單的動作。他說,對於當時人工智能的進步,有些人沾沾自喜,說好像登月計劃中人類離月亮更進一步了,其實,就是站上了一塊石頭對著月亮抒情,啊,我離你更近了。他對自己事業的自我嘲諷,讓我至今記憶非常深刻。
後來有人就想,機器為什麽要向人學習邏輯呢,又難學又學不好,機器本身最強大的是計算能力和數據處理能力,為什麽不揚長避短、另走一條道路呢?這條道路就是ibm“深藍”走過的道路。1997年5月11日,國際象棋大師卡斯帕羅夫在和ibm公司開發的計算機“深藍”進行對弈時宣布失敗,計算機“深藍”因此贏得了這場意義深遠的“人機對抗”。“深藍”不是靠邏輯、不靠所謂的人工智能取勝的,就是靠超強的計算能力取勝:思考不過你,但是算死你。
類似的邏輯在後續也用到了機器翻譯上。穀歌、微軟和ibm都走上了這條道路。就是主要采用匹配法,同時結合機器學習,依賴於海量的數據及其相關相關統計信息,不管語法和規則,將原文與互聯網上的翻譯數據對比,找到最相近、引用最頻繁的翻譯結果做為輸出。也就是利用大數據以及機器學習技術來實現機器翻譯。現有的數據量越是龐大,那麽這個係統就能越好地運行,這也正是為何新的機器翻譯隻有在互聯網出現以後才有可能重新取得突破性進展的原因所在。
因此,目前這些公司機器翻譯團隊中,有不少計算機科學家,但卻連一個純粹的語言學家也沒有,隻要擅長數學和統計學,然後又會編程,那就可以了。
總而言之,利用這種技術,計算機教會自己從大數據中建立模式。有了足夠大的信息量,你就能讓機器學會做看上去有智能的事情,別管是導航、理解話語、翻譯語言,還是識別人臉,或者模擬人類對話。英國劍橋微軟研究院的克裏斯·畢肖普(chrisbishop)打了個比方:“你堆積足夠多的磚塊,然後退上幾步,就能看到一座房子。”