果然,一切都充滿“驚喜”。
邁過那道加大加寬的黃色屏蔽門後,映入眼簾的是四個紅色大橫幅,上麵寫著:
頭上懸著三把劍:
如何逆轉非編碼區基因變異進程?
腺病毒究竟如何通過影響非編碼rna影響植物?
倒計時2555天。
盧赫掐著指頭算了算,2555天差不多是7年。
不是還有13年嗎,怎麽還縮水了呢?這可不是什麽好消息。
滿腹狐疑地經過那套熟悉的複雜流程,他來到了實驗室內,明亮的燈光刺得他睜不開眼睛。
這些鑲嵌在吊頂上的巨大燈管,散發著一種奇異的色彩。他很久沒見到過如此通透的白色了。
適應了光線之後,他發現在一排空蕩蕩的生物安全櫃前站著一個熟悉而陌生的身影,正抬頭直視著頭頂的燈管,看得很入神。
他悄悄走過去,繞到對方側麵,果然是一張熟悉的臉。
“你又挺過來了?可喜可賀啊。”他忍不住調侃道。即便在知道事情原委之後,他早已對曾經把他給折騰不輕的事情釋然了,但麵對眼前的枯槁小老頭,還是沒忍住。
對方沒有回應他,依然抬頭望著燈,自顧自地說:“看到這些純白色的燈了嗎?多麽純淨的顏色。”
“日光燈誰沒見過?汞蒸氣產生紫外光,紫外光轟擊熒光粉後的二級光子,就是純淨的白光。好看舒服但是費電,奢侈!”盧赫忍不住批判。
對方搖了搖頭,“這可不是日光燈,而是節能led。藍色自發光材料的催化過程被攻克了,全光譜led已經開始量產。即便維持能源現狀,以後所有人也都能擁有燈光自由。”
盧赫不以為然地點了點頭。他對這些並不感冒,心裏滿滿都是對7年倒計時的疑惑,“門口的標語看到了吧,倒計時隻有7年,為什麽?”
對方把目光投在盧赫臉上,緩緩開口:“因為我從最後一次被編輯,到第一次發病,期間間隔了7年多。”
盧赫愣了一下,“我們的基因相似度大概還剩99.6%,你的現在是多少?”
“時間太久遠,我無法考究到我的原始基因組,我目前的基因組和時間間隔最久的一次,相似度是99.2%。”
“呦嗬,那海總您要保重啊,再過幾個月,你和最初的你說不定就生殖隔離了!”
對方的臉上飄過一絲無奈,“我正好要找你,我們正在建立數據集,需要我盡可能多的基因組數據。2年前你跑到我公司揪下來的我的頭發,還有沒有?”
盧赫轉了轉眼珠,“沒了,不過我可能還有測序結果,在我家裏放著。”
“放哪裏了,我讓人去取一下。”對方語氣驚喜。
“沒必要。”盧赫回憶起往事,“我當初從你頭發裏提了三組基因,分別寄給三個公司測序,其中就有你們公司。你調下數據就行。”
“找過了,沒有。可能大停電的時候,損失了。”
盧赫無奈道:“我能先問下你們目前是什麽思路嗎?你要搞機器學習?那種不可解釋的黑箱,有用嗎?”
對方點頭認可,“沒錯,我們就是要做機器學習,而且是具備可解釋性的小樣本機器學習。至於你說的黑箱,就算有些方法是黑箱,但好用就行了。
你們之前用的crispr脫靶分析軟件,其實就用了這種技術。那是巨硬亞洲研究院前幾年的成果。
他們建立了一個大型的數據集,記錄了與給定的向導rna有一項核苷酸不匹配的所有可能的標靶區域裏發生的脫靶活動。
然後把數據喂給了一個兩個隱藏層的神經網絡,訓練出了一個可以輸出所有潛在脫靶位點的模型。這是一個生成模型,可以得到每個脫靶位點的概率,據此計算脫靶評分。”
“太普通了,這隻是實現了一個二線工具,還有沒有更驚豔的?”盧赫追問。
“有。
非同源末端連接機製還記得吧?剪刀剪完基因序列後,不管三七二十一直接把斷裂的基因給粘起來。
這種方式並不常用,一般都是用同源模板修複。一方麵是剪的時候可能剪了不止一個地方,粘的時候卻可能隻粘了其中一個。另一方麵是細胞不樂意了直接就不粘了。
但有團隊利用機器學習算法準確地預測到了細胞容易修複的基因位點,並用crispr和非同源末端連接治了病。
為了探索具有代表性的人類基因組序列的修複產物,他們設計了一千多個目標位點,特征是向導rna和靶標基因,標簽是非同源末端連接最終起了修複作用位點。
數據喂給了一個看起來結構很複雜的模型,訓練結果很是喜人,模型對11%的向導rna的修複位點的預測準確率在50%以上。
意味著這些向導rna和相應靶標基因所對應的疾病,可以用這種方式來治療。
最終他們治愈了赫曼斯基-普德拉克綜合征,一種能凝血不足和白化病的遺傳病。體外測試的修複準確率高達94%。
這個夠驚豔嗎?”
盧赫連連點頭,“夠。這個思路不錯,是不是可以用在你身上,特征是某時間點的基因組,標簽是未來的變異位點,提前預測變異,在發病前做修複?”
“沒錯。”對方肯定道。
“可是這種方式,用在你一個人身上好說,其他人呢?萬一我們未來都要跟你一樣,總不能每個人都建一個模型吧?”
“也不是不可以。不過還是希望未來有別的辦法。這個思路已經被提上日程了,底下四層全是測序中心的地盤。”
盧赫露出了難以置信的表情,繼而又滿懷期待地追問,“也不對啊,我記得我當初給你測序的時候,你突變的位點很多都在編碼區的。也許我們和你不一樣。”
“沒太大差別,前期確實大都在編碼區,但後來也往非編碼區發展了。
非編碼區早就不是最初認知中的“垃圾”區,隨著研究的推進,它的重要作用也被逐漸揭示。之所以我年紀越大越嚴重,很可能就是因為後期突變在了非編碼區。
很顯然,那裏不是可以隨意落筆的空白畫布,而是地獄的入口,是禁區。”
對方說完,歎了一口氣,便又開始仰頭看燈,“我的測序結果放在你家哪裏?得盡快派人去取,樣本本來就不多,數據很珍貴。”
“不用找別人,我自己去吧,我也不確定在不在,在哪裏。”
不一會兒,他又從鄭k手裏弄到了車鑰匙,還收到了一連串的囑咐:
四通八達的隧道隻限本市,去外市有一段路要走地上。
除了第110號掩體以外,其餘的都還沒有下移動通訊網絡,沒法定位,需要熟記地圖。
這兩天天氣不錯,風不大,能見度好,路上也沒人。但別開太快,路麵有沙子,滑。
出去之前,找後勤給車上加點配重。
邁過那道加大加寬的黃色屏蔽門後,映入眼簾的是四個紅色大橫幅,上麵寫著:
頭上懸著三把劍:
如何逆轉非編碼區基因變異進程?
腺病毒究竟如何通過影響非編碼rna影響植物?
倒計時2555天。
盧赫掐著指頭算了算,2555天差不多是7年。
不是還有13年嗎,怎麽還縮水了呢?這可不是什麽好消息。
滿腹狐疑地經過那套熟悉的複雜流程,他來到了實驗室內,明亮的燈光刺得他睜不開眼睛。
這些鑲嵌在吊頂上的巨大燈管,散發著一種奇異的色彩。他很久沒見到過如此通透的白色了。
適應了光線之後,他發現在一排空蕩蕩的生物安全櫃前站著一個熟悉而陌生的身影,正抬頭直視著頭頂的燈管,看得很入神。
他悄悄走過去,繞到對方側麵,果然是一張熟悉的臉。
“你又挺過來了?可喜可賀啊。”他忍不住調侃道。即便在知道事情原委之後,他早已對曾經把他給折騰不輕的事情釋然了,但麵對眼前的枯槁小老頭,還是沒忍住。
對方沒有回應他,依然抬頭望著燈,自顧自地說:“看到這些純白色的燈了嗎?多麽純淨的顏色。”
“日光燈誰沒見過?汞蒸氣產生紫外光,紫外光轟擊熒光粉後的二級光子,就是純淨的白光。好看舒服但是費電,奢侈!”盧赫忍不住批判。
對方搖了搖頭,“這可不是日光燈,而是節能led。藍色自發光材料的催化過程被攻克了,全光譜led已經開始量產。即便維持能源現狀,以後所有人也都能擁有燈光自由。”
盧赫不以為然地點了點頭。他對這些並不感冒,心裏滿滿都是對7年倒計時的疑惑,“門口的標語看到了吧,倒計時隻有7年,為什麽?”
對方把目光投在盧赫臉上,緩緩開口:“因為我從最後一次被編輯,到第一次發病,期間間隔了7年多。”
盧赫愣了一下,“我們的基因相似度大概還剩99.6%,你的現在是多少?”
“時間太久遠,我無法考究到我的原始基因組,我目前的基因組和時間間隔最久的一次,相似度是99.2%。”
“呦嗬,那海總您要保重啊,再過幾個月,你和最初的你說不定就生殖隔離了!”
對方的臉上飄過一絲無奈,“我正好要找你,我們正在建立數據集,需要我盡可能多的基因組數據。2年前你跑到我公司揪下來的我的頭發,還有沒有?”
盧赫轉了轉眼珠,“沒了,不過我可能還有測序結果,在我家裏放著。”
“放哪裏了,我讓人去取一下。”對方語氣驚喜。
“沒必要。”盧赫回憶起往事,“我當初從你頭發裏提了三組基因,分別寄給三個公司測序,其中就有你們公司。你調下數據就行。”
“找過了,沒有。可能大停電的時候,損失了。”
盧赫無奈道:“我能先問下你們目前是什麽思路嗎?你要搞機器學習?那種不可解釋的黑箱,有用嗎?”
對方點頭認可,“沒錯,我們就是要做機器學習,而且是具備可解釋性的小樣本機器學習。至於你說的黑箱,就算有些方法是黑箱,但好用就行了。
你們之前用的crispr脫靶分析軟件,其實就用了這種技術。那是巨硬亞洲研究院前幾年的成果。
他們建立了一個大型的數據集,記錄了與給定的向導rna有一項核苷酸不匹配的所有可能的標靶區域裏發生的脫靶活動。
然後把數據喂給了一個兩個隱藏層的神經網絡,訓練出了一個可以輸出所有潛在脫靶位點的模型。這是一個生成模型,可以得到每個脫靶位點的概率,據此計算脫靶評分。”
“太普通了,這隻是實現了一個二線工具,還有沒有更驚豔的?”盧赫追問。
“有。
非同源末端連接機製還記得吧?剪刀剪完基因序列後,不管三七二十一直接把斷裂的基因給粘起來。
這種方式並不常用,一般都是用同源模板修複。一方麵是剪的時候可能剪了不止一個地方,粘的時候卻可能隻粘了其中一個。另一方麵是細胞不樂意了直接就不粘了。
但有團隊利用機器學習算法準確地預測到了細胞容易修複的基因位點,並用crispr和非同源末端連接治了病。
為了探索具有代表性的人類基因組序列的修複產物,他們設計了一千多個目標位點,特征是向導rna和靶標基因,標簽是非同源末端連接最終起了修複作用位點。
數據喂給了一個看起來結構很複雜的模型,訓練結果很是喜人,模型對11%的向導rna的修複位點的預測準確率在50%以上。
意味著這些向導rna和相應靶標基因所對應的疾病,可以用這種方式來治療。
最終他們治愈了赫曼斯基-普德拉克綜合征,一種能凝血不足和白化病的遺傳病。體外測試的修複準確率高達94%。
這個夠驚豔嗎?”
盧赫連連點頭,“夠。這個思路不錯,是不是可以用在你身上,特征是某時間點的基因組,標簽是未來的變異位點,提前預測變異,在發病前做修複?”
“沒錯。”對方肯定道。
“可是這種方式,用在你一個人身上好說,其他人呢?萬一我們未來都要跟你一樣,總不能每個人都建一個模型吧?”
“也不是不可以。不過還是希望未來有別的辦法。這個思路已經被提上日程了,底下四層全是測序中心的地盤。”
盧赫露出了難以置信的表情,繼而又滿懷期待地追問,“也不對啊,我記得我當初給你測序的時候,你突變的位點很多都在編碼區的。也許我們和你不一樣。”
“沒太大差別,前期確實大都在編碼區,但後來也往非編碼區發展了。
非編碼區早就不是最初認知中的“垃圾”區,隨著研究的推進,它的重要作用也被逐漸揭示。之所以我年紀越大越嚴重,很可能就是因為後期突變在了非編碼區。
很顯然,那裏不是可以隨意落筆的空白畫布,而是地獄的入口,是禁區。”
對方說完,歎了一口氣,便又開始仰頭看燈,“我的測序結果放在你家哪裏?得盡快派人去取,樣本本來就不多,數據很珍貴。”
“不用找別人,我自己去吧,我也不確定在不在,在哪裏。”
不一會兒,他又從鄭k手裏弄到了車鑰匙,還收到了一連串的囑咐:
四通八達的隧道隻限本市,去外市有一段路要走地上。
除了第110號掩體以外,其餘的都還沒有下移動通訊網絡,沒法定位,需要熟記地圖。
這兩天天氣不錯,風不大,能見度好,路上也沒人。但別開太快,路麵有沙子,滑。
出去之前,找後勤給車上加點配重。