亚洲一区二区三区免费,亚洲综合极品香蕉久久网,国产成人精欧美精品视频,怡红院色视频在线

      亚洲一区二区三区免费,亚洲综合极品香蕉久久网,国产成人精欧美精品视频,怡红院色视频在线

      當前位置:首頁(yè) > 專(zhuān)題 > 科普生活

      “生物計算”是什么?為什么中國不能落后?

      【信息來(lái)源:【作者:【信息時(shí)間:2021-12-20 08:58  閱讀次數: 】【字號 】【我要打印】【關(guān)閉

      什么是生物計算?

      如果有一位科學(xué)家跟你說(shuō),他是做蛋白質(zhì)結構研究的,我想絕大多數人腦海中會(huì )浮現出這樣的景象:他穿著(zhù)白大褂,聚精會(huì )神地坐在顯微鏡前觀(guān)察。這似乎已經(jīng)成了生物化學(xué)家的標準形象。然而有一天你去他辦公室,卻發(fā)現根本看不到顯微鏡和試管,只看到他穿著(zhù)寬大舒服的便裝,在電腦上噼里啪啦地敲代碼,這個(gè)景象必然會(huì )讓很多人大吃一驚。實(shí)際上,準確地說(shuō),這位科學(xué)家是一位生物計算學(xué)家(或計算生物學(xué)家)。他的研究對象的確是像蛋白質(zhì)或者 DNA 這樣微小的生物活性物質(zhì),但他和傳統的生物化學(xué)家不同的是,他的研究工具不是試管和顯微鏡,而是——計算機。

      很多人在初次看到類(lèi)似“某某公司進(jìn)軍生物計算”這樣的新聞標題時(shí),往往會(huì )產(chǎn)生強烈的不明覺(jué)厲的感覺(jué)。甚至有人以為是該公司要用生物活性物質(zhì)來(lái)制造計算機,就像科幻電影中出現的那種插滿(mǎn)電極的一攤軟乎乎的腦組織。

      這真是一個(gè)天大的誤會(huì )。這些新聞其實(shí)說(shuō)的是:某公司要設計一種 AI 算法,它能夠根據有限的蛋白質(zhì)信息,準確地繪制出蛋白質(zhì)的三維結構。打個(gè)形象的比喻,這家公司相當于要幫助警察設計一個(gè)程序,它能根據受害人的描述,準確地繪制出兇手的外貌。繪制出某個(gè)蛋白質(zhì)的三維結構對于新藥研發(fā),例如新冠病毒的疫苗研發(fā)有著(zhù)極其重大的意義。但是,這個(gè)問(wèn)題也極為困難,它是當今人類(lèi)科學(xué)面臨的幾個(gè)至關(guān)重要的挑戰之一。想要知道它難在哪里,又為什么意義重大,往下看。

      蛋白質(zhì)折疊問(wèn)題

      蛋白質(zhì)從微觀(guān)上來(lái)說(shuō),就是一團有機大分子。它是構成生命的基本零件,每一種蛋白質(zhì)都有一個(gè)特定的三維結構,但這種三維結構有一個(gè)特殊之處:它一定是由一根長(cháng)長(cháng)的鏈條折疊而成的。要理解蛋白質(zhì)的三維結構到底是怎樣的,你只需要去玩一種叫“百變魔尺”的兒童玩具,就能馬上理解。百變魔尺是一節一節的,每一節都可以做各個(gè)角度的翻轉。因此,你可以把一根長(cháng)長(cháng)的魔尺折疊成各種各樣的形狀,魔尺的節數越多,能夠折疊出的形狀數量就會(huì )呈指數級的增長(cháng)。

      組成蛋白質(zhì)的基本單元是氨基酸,它就像魔尺的一個(gè)“節”。蛋白質(zhì)剛剛生成時(shí),就像一根長(cháng)長(cháng)的幾十到幾百節的魔尺。然后,它會(huì )在幾微秒到幾毫秒的時(shí)間內,迅速地折疊成一個(gè)特定的形狀。因此,在電子顯微鏡中,每一個(gè)蛋白質(zhì)就像是一團亂麻。

      因此,決定一個(gè)蛋白質(zhì)性狀和功能的,就是構成蛋白質(zhì)的氨基酸序列和蛋白質(zhì)最終折疊成的形狀。比如,我們的免疫系統在面對病毒和細菌入侵時(shí),就會(huì )產(chǎn)生一種“Y”字形的抗體蛋白。它們的形狀就像是一個(gè)抓娃娃機的夾子,能夠精確瞄準并夾住這些入侵者。

      我們的韌帶、骨骼和皮膚之間有大量的膠原蛋白。它們的形狀就像是由三根粗繩擰成的麻花,為我們的皮膚提供張力,使其顯得有彈性。

      再比如,2020 年獲得諾獎的基因定點(diǎn)編輯技術(shù) CRISPR,也正是利用了一個(gè)長(cháng)得像螃蟹鉗子的 CAS9 蛋白。它會(huì )“緊緊地夾住”基因組中某段特定的 DNA,從而進(jìn)行剪切。

      因此,科學(xué)家們對蛋白質(zhì)最感興趣的是 2 個(gè)信息:一個(gè)是蛋白質(zhì)的氨基酸序列,你可以想象成魔尺的那些“節”;另一個(gè)則是蛋白質(zhì)的結構,也就是魔尺折疊后的形狀。序列信息相對容易獲得,但結構信息卻極難獲得。偏偏結構信息又更重要,因為知道了一個(gè)未知蛋白質(zhì)的結構,就可以更準確地理解它在細胞中的作用。如果這個(gè)蛋白質(zhì)與某種疾病相聯(lián)系,那么科學(xué)家們就能根據它的結構形狀,開(kāi)發(fā)出相應的藥物。1972 年,諾貝爾化學(xué)獎獲得者克里斯蒂安·安芬森提出了一個(gè)假說(shuō):其實(shí)我們只需要知道一個(gè)信息就足夠了。因為他在實(shí)驗中發(fā)現,一個(gè)蛋白質(zhì)只要序列不發(fā)生改變,并且一直處于同一個(gè)化學(xué)環(huán)境中,那么它每次都能折疊成一樣的三維結構。所以,蛋白質(zhì)在三維空間中該如何折疊,這些信息其實(shí)已經(jīng)包含在了它的氨基酸序列中。換句話(huà)說(shuō),如果我們知道了一個(gè)蛋白質(zhì)的氨基酸序列,理論上我們就應該能推測出它的三維結構。

      安芬森的這個(gè)假說(shuō)得到了全世界同行的認可。然而科學(xué)家們很快就發(fā)現,好像知道了這個(gè)理論也沒(méi)什么用。雖然我們能在實(shí)驗室中相對容易地測出一個(gè)蛋白質(zhì)的氨基酸序列,但拿到這個(gè)序列,我們依然無(wú)法根據某條物理法則準確推測出它的三維結構。對此,科學(xué)家們已經(jīng)研究了將近 50 年,直到今天也沒(méi)有徹底弄清楚蛋白質(zhì)折疊的規律。這個(gè)問(wèn)題在生物化學(xué)界被稱(chēng)為“蛋白質(zhì)折疊問(wèn)題”,它是 21 世紀人類(lèi)科學(xué)面臨的幾大挑戰之一。

      燒錢(qián)的產(chǎn)業(yè)

      現在的科學(xué)家想要弄清楚一個(gè)蛋白質(zhì)的三維結構,唯一的辦法只能是耗費巨大的人力、物力,用極其笨拙的方法,通過(guò)大量的重復性實(shí)驗來(lái)找到蛋白質(zhì)的三維結構。需要的實(shí)驗設備如冷凍電鏡、X 射線(xiàn)晶體衍射儀、核磁共振儀等都價(jià)格昂貴。例如一臺冷凍電鏡的價(jià)格就高達數百萬(wàn)至幾千萬(wàn)人民幣。解析結構的過(guò)程是否順利有很大的運氣成分。運氣不好的時(shí)候,重復個(gè)上千次實(shí)驗都有可能出不來(lái)結果。因此,每解析一個(gè)蛋白質(zhì)結構,通常的成本在幾萬(wàn)到幾十萬(wàn)美元之間。

      從上世紀末開(kāi)始,以 IBM 為首的一些計算機技術(shù)公司就提出了一個(gè)大膽的設想:可以通過(guò)蛋白質(zhì)的氨基酸序列,利用超級計算機來(lái)預測蛋白質(zhì)的三維結構。這相當于把原先在試管中進(jìn)行的實(shí)驗,轉移到電腦的數字空間中進(jìn)行。這個(gè)想法在當時(shí)非常大膽和前衛,因為它的運算量對于當時(shí)的計算機來(lái)說(shuō)是天文數字。你可能好奇:預測一個(gè)蛋白質(zhì)的折疊,怎么會(huì )需要海量的計算?粗略地說(shuō),計算過(guò)程就好像在彩票箱中摸獎。一個(gè)擁有 100 個(gè)氨基酸的蛋白質(zhì),你想象成是一個(gè)擁有 100 節的魔尺,它共可以產(chǎn)生約 10^94 次方種不同的形狀。這個(gè)數量已經(jīng)遠遠超過(guò)了整個(gè)宇宙中基本粒子的數量。計算機要做的事情其實(shí)就是排除法。根據一定的規則,先是一批批排除某類(lèi)絕對不可能的結構,然后再根據蛋白質(zhì)表現出來(lái)的性狀一個(gè)一個(gè)地排除。到了最后階段就像是不停地在一個(gè)巨大的彩票箱中抽獎,每抽一次都要耗費巨大的運算量。

      IBM 用了 5 年的時(shí)間搞研發(fā),終于在 2004 年宣布:世界上最大的超級電腦“藍色基因”(Blue Gene)問(wèn)世。它的主要目標就是解決蛋白質(zhì)折疊問(wèn)題。然而,事情進(jìn)展得并不像計算機專(zhuān)家們估計的那樣樂(lè )觀(guān)。10 年之后,藍色基因升級了三代,超級計算機也沒(méi)能取代試管、X 射線(xiàn)晶體衍射和核磁共振。IBM 也遺憾地終止了藍色基因系列的開(kāi)發(fā)。

      不過(guò),IBM 的失敗并不代表計算機模擬蛋白質(zhì)結構的失敗。恰恰相反,在 IBM 的帶動(dòng)下,參與這項挑戰的團隊越來(lái)越多,成果也越來(lái)越豐富。各種各樣奇妙的解題思路層出不窮,最好玩的例子是華盛頓大學(xué)的大衛·貝克(Davided Baker)教授的發(fā)明。

      2008 年,他的團隊開(kāi)發(fā)出了一款名叫“Foldit”的解謎游戲。而這款解謎游戲的內容就是讓用戶(hù)憑借自己的直覺(jué)來(lái)折疊蛋白質(zhì),然后根據一定的規則獲得分數。結果非常喜人,一個(gè)困擾了生物學(xué)家 15 年之久的猴類(lèi)艾滋病毒相關(guān)蛋白,作為謎題被上傳到游戲后,玩家們只用了 10 天就成功地破解了它最可能的折疊方式。

      從 1994 年開(kāi)始,就誕生了一個(gè)名叫 CASP 的國際蛋白質(zhì)結構預測競賽。每?jì)赡昱e辦一次,參賽隊伍越來(lái)越多,全球的科技大佬云集。這個(gè)競賽中,裁判會(huì )給每個(gè)小組預測的結構進(jìn)行打分,滿(mǎn)分 100 分。在 2020 年 12 月結束的第 14 屆競賽中,傳來(lái)一個(gè)令人震驚的消息:曾經(jīng)開(kāi)發(fā)出著(zhù)名的圍棋程序 AlphaGo 的谷歌公司人工智能團隊,他們開(kāi)發(fā)的 AlphaFold 程序獲得冠軍,得到了 92.4 分。而上一屆同樣是冠軍的它,得分還不到 60 分,這種進(jìn)步的速度太令人震驚了。AlphaFold 預測的蛋白質(zhì)結構已經(jīng)非常接近于真實(shí)實(shí)驗做出來(lái)的結果,人類(lèi)離計算機攻克蛋白質(zhì)折疊問(wèn)題只有一步之遙。

      中國理應入場(chǎng)

      到此你對“生物計算”應該已經(jīng)有了一個(gè)初步的概念。不知道你發(fā)現沒(méi),前文講了這么多,居然沒(méi)有一次提到中國。具有如此重要意義的一項科學(xué)事業(yè),過(guò)去的幾十年基本上都是老外在玩兒,沒(méi)我們中國人什么事,這真的讓我感到揪心。對于未來(lái)的新藥研發(fā)、疫苗研發(fā)、精準醫療等等生物醫學(xué)技術(shù),我幾乎可以肯定地說(shuō):得生物計算者得天下。傳統的試管加電鏡式的研發(fā)模式,終將被 AI 所取代。這項科學(xué)研究事業(yè),理應上升到國家戰略的高度。

      手機掃一掃
      官方微博 官方微博
      微信公眾號 微信公眾號