“簡單舉一個例子,比如‘東坡’二字,在曆史典籍裏隨時會出現,隻有在作為主語和賓語,而且謂語為人可以施行或者接受的動作的時候,我們才可以大體判定這裏的‘東坡’是指人。”
“因此‘與東坡同醉’,這樣的語句我們可以粗判為與蘇軾有關,而‘醉於東坡’,東坡不是賓語,我們就讓程序認為與蘇軾無關。”
“當然也有兩可之間的,例如‘東坡有田’,這一類語句就還需要擴展判定,這底下涉及到一整套的句法分析邏輯。”
“最後我們會得到這麽一批和蘇軾有關的子標簽,還有一批與其關連較為緊密的關係人,比如這裏的‘蘇洵’,‘蘇轍’,‘王弗’,‘宋仁宗’,‘曹太後’,‘章惇’等。”
“我們暫時先屏蔽掉這類人物標簽,僅通過之前的‘軾’,‘子瞻’,‘東坡’三個標簽來確定子標簽,開始在文庫當中檢索。”周至熟練地操作和講解道:“看,最終我們就會得到幾千條與蘇東坡有關的資料。”
“當然了,我給幾位老師展示的是以前的項目,這是運算後的結果,具體的真實運算過程還是需要一些時間的,不可能這麽快。”
“在這幾千條記錄當中,我們可以分作幾類。”周至一敲鍵盤,數千條記錄,分出了好幾種顏色。
“一類是包含時間的,一類是包含地點的,一類是包含官職的。”周至再一敲鍵盤,三類數據開始重新排列聚合:“我們根據蘇軾的職官、任職地變化,宋史年號,用字用號的變化等等,便能夠將這數千條記錄排出一個《蘇東坡行狀》,並在此基礎上排出一個《東坡軼事匯編》。”
“這兩本書對於研究蘇東坡生平履曆,職官履曆,朋友,親友,政治盟友與政敵,思想理念等等,都具有非常重要的意義,是非常好用的工具書。”
“現在我們已經完成了這兩步工作,正在分析《蘇東坡全集》中的詩詞,以確定其詩詞的創作時期。”
“比如他的《贈劉景文》,我們可以從他的章奏和筆記中看出,他是在哲宗元祐五年,在任杭州時認識的,在元祐五年蘇軾曾經向朝廷奏報已經五十八歲的劉景文,稱許他為‘慷慨奇士’,結合詩歌環境,應該是作於元祐五年秋末冬初。”
“諸如此類的分析函數有很多,我們甚至有了許多新的發現。他的《和子由黽池懷舊》,詩歌的背景,在檢索資料當中就顯得一目了然。”
“蘇轍十九歲被委任為黽池,不過並未就任就中了進士,隨後改任,因此懷舊不會是懷的這個舊,而是嘉佑三年,蘇軾父子三人入京應試,路過黽池,寄宿僧舍時作過幾首詩於牆上。”
“嘉佑六年,兄弟二人同中製科,蘇軾被任為鳳翔通判,蘇轍送蘇軾上任,至鄭州分手,因為蘇軾此去要經過黽池,想起弟弟的舊作,便取出來寫了一首和詩。”
“因此這首詩的年代就可以確定了,乃是嘉佑六年去鳳翔任中所作。”
“由此我們便可以將蘇軾的詩詞重新打亂,排出一個《東坡詩詞編年考》來。”
“在過去,想要得到《蘇東坡行狀》、《東坡軼事匯編》、《東坡詩詞編年考》這三部著作,需要一個對蘇東坡研究極深的學者大擘,窮盡一生之力方才寫得出來,其中還難免出現不少的舛誤,而現在我們根據這套引擎工具,很輕鬆就可以從海量的資料當中提取出來。”
“而且工具成熟以後,我們還可以同步對大量的宋代人物進行分析,得到《歐陽修行狀》、《歐陽修軼事匯編》、《歐陽修詩文編年考》;《司馬光行狀》、《司馬光軼事匯編》、《司馬光詩詞編年考》;《王安石行狀》《王安石軼事匯編》、《王安石詩詞編年考》來。”
“當然了,除了這些,還有許多宋代研究上的老大難問題,我們也在嚐試用這類辦法來解決。”
“比如宋代官職的複雜程度,堪稱封建王朝之最,不過關於這個的檢索算法也最簡單明晰,各種史料的《職官》一部,描述得也很詳細。”
“不過每個官職在宋代除了正式的公文上會出現正稱外,在大量關於日常交往,上下級對話,朋友書信往來當中,會被各種代稱來替換,讓情況變得更加的複雜,比如知州,其正式的名稱應該是知某州軍州事,然而在書信往來當中,多以前朝的‘太守’或者‘大尹’等代替。”
“而從就任官員等級上區分,名稱又分‘知’,‘充’,‘權知’,‘權充’,‘權發遣’等方式;”
“此外還有‘遙領’,就是給宗室成員一個名義上的地方長官名義,人壓根不去,留在京城按照官職領一份俸祿而已。”
“另有一種情況,就是雖然到了地方任職,其實‘不得簽書公事’,就是流放到某地,由地方官員監管,不得出州境,屬於保留職務級別的軟禁,比如白居易的江州司馬,蘇東坡的黃州通判,就是此類。”
“為此我們正在檢索宋代資料,創建一本《兩宋職官詞典》,將來也會將這個工具,推廣到其他朝代。”
“這是目前為止我們能夠想到的,依托於數字圖書館,搜索引擎,大數據分析三種開發應用的基礎上構建起來的文科項目,受目光和學識的限製,目前在做的就是這些,我們也希望各位專家能夠加入到我們的項目裏邊來,發掘出更多更好的項目,將數字圖書館充分地利用起來,為我們的文科項目添磚加瓦。”
“這從古至今,曆朝曆代的商品物價是一個很難定性的東西。”一名坐在辜幼文身邊的老者便說道:“古代流通不暢,比如宋代,三個相對大的經濟區,分別是汴京、杭揚、蜀中四路。”
“因為交通的不便,各處地方的同一商品,物價並不統一。”老者繼續說道:“如宋代蜀中,還使用鐵錢和交子,而在外路,因為錢荒,鹽引也充當了相當一部分的貨幣功能。”
“除此以外,因為曆年的豐欠不一,鬥米甚至可以從一鬥賤至七文,到一鬥高達數貫之間浮動,這種劇烈的波動幅度,也給斷定那個時代的經濟發展水平帶來了極大的障礙。”
“要是能夠得到一個兩宋各種物資,在各個地區,各個年代的物價圖,那就好了。”
“因此‘與東坡同醉’,這樣的語句我們可以粗判為與蘇軾有關,而‘醉於東坡’,東坡不是賓語,我們就讓程序認為與蘇軾無關。”
“當然也有兩可之間的,例如‘東坡有田’,這一類語句就還需要擴展判定,這底下涉及到一整套的句法分析邏輯。”
“最後我們會得到這麽一批和蘇軾有關的子標簽,還有一批與其關連較為緊密的關係人,比如這裏的‘蘇洵’,‘蘇轍’,‘王弗’,‘宋仁宗’,‘曹太後’,‘章惇’等。”
“我們暫時先屏蔽掉這類人物標簽,僅通過之前的‘軾’,‘子瞻’,‘東坡’三個標簽來確定子標簽,開始在文庫當中檢索。”周至熟練地操作和講解道:“看,最終我們就會得到幾千條與蘇東坡有關的資料。”
“當然了,我給幾位老師展示的是以前的項目,這是運算後的結果,具體的真實運算過程還是需要一些時間的,不可能這麽快。”
“在這幾千條記錄當中,我們可以分作幾類。”周至一敲鍵盤,數千條記錄,分出了好幾種顏色。
“一類是包含時間的,一類是包含地點的,一類是包含官職的。”周至再一敲鍵盤,三類數據開始重新排列聚合:“我們根據蘇軾的職官、任職地變化,宋史年號,用字用號的變化等等,便能夠將這數千條記錄排出一個《蘇東坡行狀》,並在此基礎上排出一個《東坡軼事匯編》。”
“這兩本書對於研究蘇東坡生平履曆,職官履曆,朋友,親友,政治盟友與政敵,思想理念等等,都具有非常重要的意義,是非常好用的工具書。”
“現在我們已經完成了這兩步工作,正在分析《蘇東坡全集》中的詩詞,以確定其詩詞的創作時期。”
“比如他的《贈劉景文》,我們可以從他的章奏和筆記中看出,他是在哲宗元祐五年,在任杭州時認識的,在元祐五年蘇軾曾經向朝廷奏報已經五十八歲的劉景文,稱許他為‘慷慨奇士’,結合詩歌環境,應該是作於元祐五年秋末冬初。”
“諸如此類的分析函數有很多,我們甚至有了許多新的發現。他的《和子由黽池懷舊》,詩歌的背景,在檢索資料當中就顯得一目了然。”
“蘇轍十九歲被委任為黽池,不過並未就任就中了進士,隨後改任,因此懷舊不會是懷的這個舊,而是嘉佑三年,蘇軾父子三人入京應試,路過黽池,寄宿僧舍時作過幾首詩於牆上。”
“嘉佑六年,兄弟二人同中製科,蘇軾被任為鳳翔通判,蘇轍送蘇軾上任,至鄭州分手,因為蘇軾此去要經過黽池,想起弟弟的舊作,便取出來寫了一首和詩。”
“因此這首詩的年代就可以確定了,乃是嘉佑六年去鳳翔任中所作。”
“由此我們便可以將蘇軾的詩詞重新打亂,排出一個《東坡詩詞編年考》來。”
“在過去,想要得到《蘇東坡行狀》、《東坡軼事匯編》、《東坡詩詞編年考》這三部著作,需要一個對蘇東坡研究極深的學者大擘,窮盡一生之力方才寫得出來,其中還難免出現不少的舛誤,而現在我們根據這套引擎工具,很輕鬆就可以從海量的資料當中提取出來。”
“而且工具成熟以後,我們還可以同步對大量的宋代人物進行分析,得到《歐陽修行狀》、《歐陽修軼事匯編》、《歐陽修詩文編年考》;《司馬光行狀》、《司馬光軼事匯編》、《司馬光詩詞編年考》;《王安石行狀》《王安石軼事匯編》、《王安石詩詞編年考》來。”
“當然了,除了這些,還有許多宋代研究上的老大難問題,我們也在嚐試用這類辦法來解決。”
“比如宋代官職的複雜程度,堪稱封建王朝之最,不過關於這個的檢索算法也最簡單明晰,各種史料的《職官》一部,描述得也很詳細。”
“不過每個官職在宋代除了正式的公文上會出現正稱外,在大量關於日常交往,上下級對話,朋友書信往來當中,會被各種代稱來替換,讓情況變得更加的複雜,比如知州,其正式的名稱應該是知某州軍州事,然而在書信往來當中,多以前朝的‘太守’或者‘大尹’等代替。”
“而從就任官員等級上區分,名稱又分‘知’,‘充’,‘權知’,‘權充’,‘權發遣’等方式;”
“此外還有‘遙領’,就是給宗室成員一個名義上的地方長官名義,人壓根不去,留在京城按照官職領一份俸祿而已。”
“另有一種情況,就是雖然到了地方任職,其實‘不得簽書公事’,就是流放到某地,由地方官員監管,不得出州境,屬於保留職務級別的軟禁,比如白居易的江州司馬,蘇東坡的黃州通判,就是此類。”
“為此我們正在檢索宋代資料,創建一本《兩宋職官詞典》,將來也會將這個工具,推廣到其他朝代。”
“這是目前為止我們能夠想到的,依托於數字圖書館,搜索引擎,大數據分析三種開發應用的基礎上構建起來的文科項目,受目光和學識的限製,目前在做的就是這些,我們也希望各位專家能夠加入到我們的項目裏邊來,發掘出更多更好的項目,將數字圖書館充分地利用起來,為我們的文科項目添磚加瓦。”
“這從古至今,曆朝曆代的商品物價是一個很難定性的東西。”一名坐在辜幼文身邊的老者便說道:“古代流通不暢,比如宋代,三個相對大的經濟區,分別是汴京、杭揚、蜀中四路。”
“因為交通的不便,各處地方的同一商品,物價並不統一。”老者繼續說道:“如宋代蜀中,還使用鐵錢和交子,而在外路,因為錢荒,鹽引也充當了相當一部分的貨幣功能。”
“除此以外,因為曆年的豐欠不一,鬥米甚至可以從一鬥賤至七文,到一鬥高達數貫之間浮動,這種劇烈的波動幅度,也給斷定那個時代的經濟發展水平帶來了極大的障礙。”
“要是能夠得到一個兩宋各種物資,在各個地區,各個年代的物價圖,那就好了。”