周至倒是不怕這些,畢竟島國和國內一樣,能夠處理河豚的廚師是需要考取執照的。


    馬爺不吃正好,周至正好順便把他的那一份給幹掉了。


    反倒是池田丘這樣的年輕女士,對於吃這個部位一點沒有異樣,還笑吟吟地跟周至討論口感,讓周至感慨這女的要是在國內遇到付霞,指定聊得到一處去。


    之後阪本五郎對於周至和馬爺的態度就好像有了點細微的差別,好像給周至的笑臉更多,對於馬爺就有點應付了。


    聽聞周至提出想要去靜嘉堂訪問,同時和靜嘉堂文庫的負責人討論將文庫數字化的工作,不由得對周至刮目相看:“周桑,這個想法,是在瀚文大字庫創立之前就有了的?”


    說實話的確是如此,不過周至心目中的數字化圖書館遠比現在任何人心目中的結構都要宏大得多。


    但是腦海裏邊的東西提前說出來一點用都沒有,事情隻能一步一步地做起來,現在第一步的瀚文大字庫已經完成,才說得到第二步上來。


    第二步,當然就是將典籍的內容數字化。


    周至心目中的圖書館,絕不是簡單的掃描,轉字,存儲這樣簡單的功能。


    這裏麵涉及到版本格式的數字化,文字內容的數字化,書目索引體係數字化,段落標簽的數字化,特殊詞庫數字化,訪問檢索功能的開發,以及典籍內部與外部的聯想特征接口。


    就拿《資治通鑒》來舉例,周至要的不是一個txt文檔,而是一個立體化的數據庫,研究者可以根據自己的需要,輸入“漢武帝”三個字,就能夠檢索到資治通鑒裏提到漢武帝的所有內容,由此拚合出一篇漢武帝的傳記,同時還能夠檢索出每一個段落的具體出處,以及與漢武帝這個關鍵詞有關係的一級標簽索引段落,二級標簽索引段落,三級標簽索引段落。


    比如漢武帝的五服內親人,父母,後妃,子女,重臣,重要製度,新立官製,政策,戰爭,災異,這些就屬於與之相關的一級索引。


    在位期間的其餘地方大事,諸侯,番邦等,這些內容屬於二級索引。


    以此類推。


    這樣就會把編年體的《資治通鑒》,剖析出一篇紀傳體的《漢武帝傳》,而這篇傳記上的許多內容,還可以一層一層地向下鑽取,比如皇後這一索引,就可以鑽取出衛子夫,從衛子夫,又可以鑽取出衛青,劉據。


    這些是內部接口,還有外部的,比如將《資治通鑒》和《史記》、《漢書》、《後漢書》、《五代史》、《資治通鑒長編》等再度關聯起來。


    當然這些已經是屬於將來要幹的事情了,當務之急是先要將典籍的內容數字化完成。


    也就是說,這一切的基礎,是先要得到一個“《資治通鑒》.txt”。


    還有一個步驟,也是要和這一步同時進行的,就是“版本格式設置”。


    這個是用來展示用的,周至想要讀者在瀏覽古籍的時候,體驗到翻閱古籍的效果。


    要是再過幾十年,這事兒就很簡單,將典籍的高清掃描圖片和隱藏的數碼文字鏈接到一起,就能夠輕鬆實現。


    不過現在卻不行,因為如今的存儲空間是非常珍貴的,高清掃描圖片動則一兩兆,《資治通鑒》一共三百萬字,隻需要6m的存儲空間。


    然而要是連掃描圖片一起打包的話,《資治通鑒》一共近三百冊,一萬多頁,兩頁一圖,拿起碼也需要12g。


    就算對圖片進行壓縮處理,也至少需要一兩個g才行。


    在家用電腦硬盤空間以一兩個g為主流的九四年,這麽幹就實在是太奢侈了。


    因此就需要將各種版本的《資治通鑒》的版麵信息采集起來,然後找到規律,通過程序處理,在讀者瀏覽典籍的時候,將卷麵格式和文字配套,臨時地“畫”出來。


    這個功能就無需占用大量的空間,而且實現起來難度也並不大。


    有了這兩個功能,最簡單原始的“數字圖書館”1.0版,就算是能夠出台了。


    阪本五郎本身並不懂技術,和很多外行一樣,聽了周至一通忽悠後,感覺這玩意兒實在是太高大上了。


    而且這東西整理出來後,可以到處備份,相當於能夠將一個靜嘉堂,變成無數個靜嘉堂。


    作為一個經曆過二戰的老頭,阪本五郎覺得這個什麽數字圖書館當真是非常重要。


    京都是“文化之都”,對於這樣的文化盛事,隻要攛掇成了,將來都不愁自己不青史留名。


    “我在新聞裏好像看到過,我們國家好像也派駐了一個團隊,一起協助搞字庫?”阪本五郎問道。


    這話問得就有意思了,擺明了,阪本是想要爭取一下日方在這個項目中更大的參與比重。


    這事兒當真是“人在屋簷下,不得不低頭。”,周至隻好說道:“瀚文大字庫最後這一期其實重新定義了一下,真正的名稱是‘unicode中日韓表意大區文字項目’,日韓兩國分別派遣了精幹的力量參與,大家共成其事。”


    “島國的專家是東京大學信息學教授鬆井造先生,他帶領的團隊在項目組中主要負責《字海》字卡入庫核審工作,對於島國同事嚴謹的工作態度,我們是非常倚仗的,在工作完成之後,我們的相關部委還給他們發了嘉獎狀呢。”


    “典籍掃描是一個新項目,雖然我們在前期的字卡掃描工作中,已經完成了基礎程序的開發,但是肯定也會涉及到大量的調整,優化,審核校對等繁雜的工作,我不可能長期待在島國,因此這項工作,可能會效仿瀚文字庫已經成功的合作模式,由我們國家派遣一個工作小組過來,協助貴國的專家們,完成這項工作。”


    “這裏涉及到一些程序的ip使用和升級授權,還有最後成果的知識產權共享等方麵,可能需要在靜嘉堂的話事人同意以後,再進一步細談。”


    “我的任務,其實就是想要和京都文化屆的人士探討一下這個項目的可行性,如果可以的話,我回去就讓學校跟相關部委打報告。”


    “技術方麵的事情我不懂,”阪本五郎說道:“但是經過周桑的介紹,我覺得這是一件對於中日兩國都很好的事情。”


    “靜嘉堂文庫的小野哲郎和我交往很多年了,我了解他,相信對周桑提出的這個項目,他會非常感興趣。”


    “非常非常感興趣。”

章節目錄

閱讀記錄

重生之乘風而起所有內容均來自互聯網,uu小說網隻為原作者二子從周的小說進行宣傳。歡迎各位書友支持二子從周並收藏重生之乘風而起最新章節