陳峰做的醫學圖像處理領域的數據集少得可憐,這個很容易理解,跟醫藥相關的數據大多都是各大醫院的機密,論文作者不會輕易公開。也就是因為陳峰的導師跟花城市第一人民醫院有項目合作,所以才能拿到部分相關數據。但拿到數據隻是個開始,還需要陳峰自己進行數據處理。
淩誌就沒這麽幸運了,他的研究方向跟社交媒體中的輿情分析有關,具體而言就是找出社交網絡中的水軍,也就是屬於同一個現實世界的人類的不同賬號。他們通過多個賬號發布垃圾評論擾亂社交網絡秩序為樂,甚至有的商業機構會專門雇傭水軍發表負麵言論攻擊競爭對手,影響十分惡劣。但水軍自然不會告訴你自己是水軍,而且社交網絡的數據大多都很敏感,很少有人專門整理,所以這樣的數據集很難弄到。淩誌在過去一年的時間裏在數據集上花費了大量的時間,目前他所用的比較好的辦法是將同一個人發布的推文分成2份,假裝是2個賬號發布的,雖然不夠真實,但從做實驗的角度看足夠了。
淩誌並不覺得有數據集和沒有數據集這兩種情況孰優孰劣,但淩誌相信一句話,隻要你付出,雖然不一定成功,但一定會有收獲。雖然淩誌在科研上進展緩慢,但采集社交網絡數據的過程讓他掌握了數據采集、數據分析以及數據預處理等多項技能。雖然算不上是處理數據領域的專家,但也算是積累了豐富的經驗。
“唉,話雖這麽說,但是內心還是很痛苦的呀,老哥。我自己覺得效果差不多了,但是我導並不放過我啊。”
“那算你倒黴,不過既然你導不滿意,目前來看也隻能在數據處理上再下下功夫了啊。”
“隻能這樣了,我回去再挑一挑數據,看看有沒有不幹淨的。”
“那你努力,需要幫忙跟我說一聲。”
“行,沒問題。那我先走了,拜拜。”
“拜拜。”
陳峰去了學院樓五樓,而淩誌的實驗室在二樓,所以陳峰坐電梯上去,而淩誌直接開11路走樓梯上去了。
時間還早,實驗室隻來了一個人,周敏師兄。
周敏師兄比自己大1屆,預計明年畢業。研究方向是導師王海波的老本行,多目標車輛路徑優化問題。老王在這個領域深耕了多年,發表多篇論文。底下弟子也帶過很多屆了,一開始都是做這個方向。而從周敏師兄這一屆開始,老王幡然醒悟,想要帶領部分學生在其他研究領域開荒,所以就有了淩誌現在的研究方向。
淩誌並沒有覺得有什麽不好,做老王的老本行也不見得萬事輕鬆,你的每一個實驗細節不到位都可能會遭受到王導的火眼金睛。開荒雖然也有開荒的難處,但是勝在能學到更多新知識,也有一定自由度。這裏的自由度並不是說隨意地編造實驗結果,這屬於學術造假,淩誌是不會幹這種事的。實際上說的是你數據采集的量,處理到的程度,代碼的參數設置等。而當你用自己采集到的數據集以及自己編寫的代碼跑出一個不錯的實驗結果時,即便這個實驗再簡單,你也會有無與倫比的成就感。所以淩誌對於自己的現狀非常滿足。
“早啊,周敏師兄。”
“早。”
邊說著,師兄打了一個大大的哈欠。淩誌也沒在意,坐到自己的座位上,打開電腦,準備將一篇跟詞向量相關的文章打印出來仔細看看。實驗室配備有一台專門的打印機,淩誌拷好論文之後拿到打印機旁邊那台電腦上插進去,可過了半天也沒讀出來盤。
“不對啊,應該不是我u盤壞了啊。”
淩誌不知道哪裏出了問題。
“師兄,打印機旁邊這條電腦壞了嗎?怎麽讀不出來我的u盤?”
淩誌問道。
“哦,那台啊,我剛剛也想打印來著,也讀不出來盤,我猜應該是卡住了吧。”
“哦,這樣啊,那為什麽不重啟一下?”
“因為我想起你小欣師姐說她在跑一個多線程程序,需要用到咱們實驗室平時閑置不怎麽用的電腦的cpu來運算。我猜她應該是用到了那台電腦吧,等你師姐來了我問問她。”
“哦哦,怪不得。”
淩誌按住鍵盤上的“ctrl+shift+esc”,想打開任務管理器看看資源占用情況,結果電腦卡的連任務管理器也打不開。
淩誌長歎一聲,師姐跑個程序也太難了,多線程跑程序都這麽卡。
默默替師姐默哀之後,淩誌回到自己的位置,準備在電腦上看論文。雖然有點傷眼睛,但問題也不是太大。
過了一會兒,淩誌大概已經掌握了論文的核心思想。於是創建了一個ppt文檔,準備做個ppt,明天組會分享一下這篇論文。
這時候實驗室已經來了一部分人了,淩誌這個時候也想休息一下,順便去倒杯水。這時候,小欣師姐剛好過來了。
“唉,小欣,你是不是在打印機那台電腦上跑了程序啊,那台電腦太卡了,我們都打印不了東西了,要不你看看程序跑得怎麽樣了?”
師姐叫張小欣,跟周敏師兄做的是同一個研究方向。
“啊!對不起對不起,都卡成這樣了嗎,我馬上去看。”
師姐並沒有跑到打印機那台電腦上去看,而是坐在自己的座位上用ssh遠程命令嚐試連接打印機那台電腦,結果連了半天都連不上。
“完了,徹底當機了啊。”
小欣師姐感歎道。所謂當機就是死機的意思。
師姐忍痛將打印機那台電腦重啟。
“唉,程序又白跑了啊。”
“早跟你說了優化下代碼,你看你這段別暴力求解……”
周敏師兄適時開始提出建議,淩誌也樂見其成,他也不懂師兄師姐做的這個方向,也沒去插嘴,自顧自地倒水去了。
“對了,老王今天來沒來實驗室?”
“昨天聽他說他今天有事,明天組會應該會到吧。”
老王不來,那還算比較輕鬆。雖然他來不來,自己今天的計劃都不會有什麽改變,但至少不會有什麽額外的事情打擾自己。
整個一天他基本都在做ppt的過程中度過,中間抽空運行了一下自己早就搭建好的一個簡單的神經網絡程序,看看在自己處理的數據集上運行效果如何。
“還是一樣爛啊。”
水軍賬號的匹配準確率隻有37%,沒什麽意義。在已有的論文中至少要跑到80%以上才算是比較好的結果。
“唉,相比陳峰,我這邊也沒好多少啊。算了,慢慢來,明天再說,回去了。”
淩誌覺得自己就是個另類,別的研究生朝九晚十一,而他晚上獨自待在宿舍幹自己的事情。淩誌一開始覺得有點內疚,不過時間久了也就給自己找好了理由。
“回去休息眼睛嘛,看一天電腦累不累得慌。”
雖然是很無聊的借口,但每天晚上花點時間看看紙質書,偶爾去球房練練球,他覺得並不是浪費時間,反而覺得很充實。尤其是在讀書的時候,每當自己白天實驗不順利時,晚上讀一會兒書總會讓自己內心平靜下來。書中人物各有各的喜怒哀樂,淩誌體會著主人公們的心情,自己的那點小情緒也就微不足道了。
“實驗做的怎麽樣了?”
淩誌來到陳峰所在的實驗室。
“唉,別提了,篩數據篩得我眼都花了。淩子,有空你幫幫我好不好,我實在是不行了。”
“行啊,你晚上把數據發給我,我抽空幫你篩一篩。”
“ok,走走走,吃飯吃飯,餓死了。”
兩人走向食堂,一路上也沒怎麽聊天,偶爾陳峰說話,淩誌不接,陳峰也不以為意,這也是淩誌覺得和陳峰相處比較舒服的一個重要原因。講話少一直是他的一塊心病,而身邊有一個講話多的人願意與你為伍,而且又不在意你講話少,淩誌覺得這樣的人自己應該珍惜。即便是陳峰經常調侃自己,但他並沒有惡意,並理解自己這種奇怪的人的存在,淩誌覺得自己很幸運。隻不過這是他心裏想的罷了,不可能對著陳峰說,要不然隻會召來更加激烈的調侃。
“你今天想吃啥?淩子。”
“我就點個雞蛋肉片蓋飯吧,簡單樸素,飯管夠。”
“那我點茄子豆角吧,想吃點茄子,你那個太淡了,一會兒可以撿幾個我盤子裏的茄子補補油水。”
“行啊,那我就不客氣了。”
兩人風卷殘雲一般解決了晚飯,陳峰繼續回實驗室,淩誌回到宿舍,拿起自己之前快看完的小說,是以前著名的懸疑推理作家東野圭吾寫的科幻小說《秘密》。故事主要講的是妻子和女兒遇到車禍,妻子魂穿女兒肉體後,男主與擁有妻子靈魂的女兒生活的故事。
看完結尾,女兒開啟了自己全新的人生,嫁為人婦,也不知道這結局是喜是悲啊。
淩誌看書有很強的代入感,經常想如果自己是男主,又會做出什麽樣的選擇呢?真的願意放手讓女兒過上全新的生活嗎?淩誌覺得自己不一定會比男主做得更好。
害,看個書而已,還傷感上了。
淩誌笑著搖了搖頭,合上書,打開了自己的電腦,找到了一段英式台球比賽錄像,這是他長久以來的習慣,有台球比賽的時候就看看直播,沒有的時候就看看錄像。而此時此刻他打開的這則錄像,則是多年前在華夏舉辦的一場大師賽上,羅尼·奧沙利文與尼爾·羅伯遜的比賽。
淩誌就沒這麽幸運了,他的研究方向跟社交媒體中的輿情分析有關,具體而言就是找出社交網絡中的水軍,也就是屬於同一個現實世界的人類的不同賬號。他們通過多個賬號發布垃圾評論擾亂社交網絡秩序為樂,甚至有的商業機構會專門雇傭水軍發表負麵言論攻擊競爭對手,影響十分惡劣。但水軍自然不會告訴你自己是水軍,而且社交網絡的數據大多都很敏感,很少有人專門整理,所以這樣的數據集很難弄到。淩誌在過去一年的時間裏在數據集上花費了大量的時間,目前他所用的比較好的辦法是將同一個人發布的推文分成2份,假裝是2個賬號發布的,雖然不夠真實,但從做實驗的角度看足夠了。
淩誌並不覺得有數據集和沒有數據集這兩種情況孰優孰劣,但淩誌相信一句話,隻要你付出,雖然不一定成功,但一定會有收獲。雖然淩誌在科研上進展緩慢,但采集社交網絡數據的過程讓他掌握了數據采集、數據分析以及數據預處理等多項技能。雖然算不上是處理數據領域的專家,但也算是積累了豐富的經驗。
“唉,話雖這麽說,但是內心還是很痛苦的呀,老哥。我自己覺得效果差不多了,但是我導並不放過我啊。”
“那算你倒黴,不過既然你導不滿意,目前來看也隻能在數據處理上再下下功夫了啊。”
“隻能這樣了,我回去再挑一挑數據,看看有沒有不幹淨的。”
“那你努力,需要幫忙跟我說一聲。”
“行,沒問題。那我先走了,拜拜。”
“拜拜。”
陳峰去了學院樓五樓,而淩誌的實驗室在二樓,所以陳峰坐電梯上去,而淩誌直接開11路走樓梯上去了。
時間還早,實驗室隻來了一個人,周敏師兄。
周敏師兄比自己大1屆,預計明年畢業。研究方向是導師王海波的老本行,多目標車輛路徑優化問題。老王在這個領域深耕了多年,發表多篇論文。底下弟子也帶過很多屆了,一開始都是做這個方向。而從周敏師兄這一屆開始,老王幡然醒悟,想要帶領部分學生在其他研究領域開荒,所以就有了淩誌現在的研究方向。
淩誌並沒有覺得有什麽不好,做老王的老本行也不見得萬事輕鬆,你的每一個實驗細節不到位都可能會遭受到王導的火眼金睛。開荒雖然也有開荒的難處,但是勝在能學到更多新知識,也有一定自由度。這裏的自由度並不是說隨意地編造實驗結果,這屬於學術造假,淩誌是不會幹這種事的。實際上說的是你數據采集的量,處理到的程度,代碼的參數設置等。而當你用自己采集到的數據集以及自己編寫的代碼跑出一個不錯的實驗結果時,即便這個實驗再簡單,你也會有無與倫比的成就感。所以淩誌對於自己的現狀非常滿足。
“早啊,周敏師兄。”
“早。”
邊說著,師兄打了一個大大的哈欠。淩誌也沒在意,坐到自己的座位上,打開電腦,準備將一篇跟詞向量相關的文章打印出來仔細看看。實驗室配備有一台專門的打印機,淩誌拷好論文之後拿到打印機旁邊那台電腦上插進去,可過了半天也沒讀出來盤。
“不對啊,應該不是我u盤壞了啊。”
淩誌不知道哪裏出了問題。
“師兄,打印機旁邊這條電腦壞了嗎?怎麽讀不出來我的u盤?”
淩誌問道。
“哦,那台啊,我剛剛也想打印來著,也讀不出來盤,我猜應該是卡住了吧。”
“哦,這樣啊,那為什麽不重啟一下?”
“因為我想起你小欣師姐說她在跑一個多線程程序,需要用到咱們實驗室平時閑置不怎麽用的電腦的cpu來運算。我猜她應該是用到了那台電腦吧,等你師姐來了我問問她。”
“哦哦,怪不得。”
淩誌按住鍵盤上的“ctrl+shift+esc”,想打開任務管理器看看資源占用情況,結果電腦卡的連任務管理器也打不開。
淩誌長歎一聲,師姐跑個程序也太難了,多線程跑程序都這麽卡。
默默替師姐默哀之後,淩誌回到自己的位置,準備在電腦上看論文。雖然有點傷眼睛,但問題也不是太大。
過了一會兒,淩誌大概已經掌握了論文的核心思想。於是創建了一個ppt文檔,準備做個ppt,明天組會分享一下這篇論文。
這時候實驗室已經來了一部分人了,淩誌這個時候也想休息一下,順便去倒杯水。這時候,小欣師姐剛好過來了。
“唉,小欣,你是不是在打印機那台電腦上跑了程序啊,那台電腦太卡了,我們都打印不了東西了,要不你看看程序跑得怎麽樣了?”
師姐叫張小欣,跟周敏師兄做的是同一個研究方向。
“啊!對不起對不起,都卡成這樣了嗎,我馬上去看。”
師姐並沒有跑到打印機那台電腦上去看,而是坐在自己的座位上用ssh遠程命令嚐試連接打印機那台電腦,結果連了半天都連不上。
“完了,徹底當機了啊。”
小欣師姐感歎道。所謂當機就是死機的意思。
師姐忍痛將打印機那台電腦重啟。
“唉,程序又白跑了啊。”
“早跟你說了優化下代碼,你看你這段別暴力求解……”
周敏師兄適時開始提出建議,淩誌也樂見其成,他也不懂師兄師姐做的這個方向,也沒去插嘴,自顧自地倒水去了。
“對了,老王今天來沒來實驗室?”
“昨天聽他說他今天有事,明天組會應該會到吧。”
老王不來,那還算比較輕鬆。雖然他來不來,自己今天的計劃都不會有什麽改變,但至少不會有什麽額外的事情打擾自己。
整個一天他基本都在做ppt的過程中度過,中間抽空運行了一下自己早就搭建好的一個簡單的神經網絡程序,看看在自己處理的數據集上運行效果如何。
“還是一樣爛啊。”
水軍賬號的匹配準確率隻有37%,沒什麽意義。在已有的論文中至少要跑到80%以上才算是比較好的結果。
“唉,相比陳峰,我這邊也沒好多少啊。算了,慢慢來,明天再說,回去了。”
淩誌覺得自己就是個另類,別的研究生朝九晚十一,而他晚上獨自待在宿舍幹自己的事情。淩誌一開始覺得有點內疚,不過時間久了也就給自己找好了理由。
“回去休息眼睛嘛,看一天電腦累不累得慌。”
雖然是很無聊的借口,但每天晚上花點時間看看紙質書,偶爾去球房練練球,他覺得並不是浪費時間,反而覺得很充實。尤其是在讀書的時候,每當自己白天實驗不順利時,晚上讀一會兒書總會讓自己內心平靜下來。書中人物各有各的喜怒哀樂,淩誌體會著主人公們的心情,自己的那點小情緒也就微不足道了。
“實驗做的怎麽樣了?”
淩誌來到陳峰所在的實驗室。
“唉,別提了,篩數據篩得我眼都花了。淩子,有空你幫幫我好不好,我實在是不行了。”
“行啊,你晚上把數據發給我,我抽空幫你篩一篩。”
“ok,走走走,吃飯吃飯,餓死了。”
兩人走向食堂,一路上也沒怎麽聊天,偶爾陳峰說話,淩誌不接,陳峰也不以為意,這也是淩誌覺得和陳峰相處比較舒服的一個重要原因。講話少一直是他的一塊心病,而身邊有一個講話多的人願意與你為伍,而且又不在意你講話少,淩誌覺得這樣的人自己應該珍惜。即便是陳峰經常調侃自己,但他並沒有惡意,並理解自己這種奇怪的人的存在,淩誌覺得自己很幸運。隻不過這是他心裏想的罷了,不可能對著陳峰說,要不然隻會召來更加激烈的調侃。
“你今天想吃啥?淩子。”
“我就點個雞蛋肉片蓋飯吧,簡單樸素,飯管夠。”
“那我點茄子豆角吧,想吃點茄子,你那個太淡了,一會兒可以撿幾個我盤子裏的茄子補補油水。”
“行啊,那我就不客氣了。”
兩人風卷殘雲一般解決了晚飯,陳峰繼續回實驗室,淩誌回到宿舍,拿起自己之前快看完的小說,是以前著名的懸疑推理作家東野圭吾寫的科幻小說《秘密》。故事主要講的是妻子和女兒遇到車禍,妻子魂穿女兒肉體後,男主與擁有妻子靈魂的女兒生活的故事。
看完結尾,女兒開啟了自己全新的人生,嫁為人婦,也不知道這結局是喜是悲啊。
淩誌看書有很強的代入感,經常想如果自己是男主,又會做出什麽樣的選擇呢?真的願意放手讓女兒過上全新的生活嗎?淩誌覺得自己不一定會比男主做得更好。
害,看個書而已,還傷感上了。
淩誌笑著搖了搖頭,合上書,打開了自己的電腦,找到了一段英式台球比賽錄像,這是他長久以來的習慣,有台球比賽的時候就看看直播,沒有的時候就看看錄像。而此時此刻他打開的這則錄像,則是多年前在華夏舉辦的一場大師賽上,羅尼·奧沙利文與尼爾·羅伯遜的比賽。