男女激情视频网站_ “生物計算”是什么？為什么中國不能落后？

什么是生物計算？

如果有一位科學(xué)家跟你說(shuō)，他是做蛋白質(zhì)結構研究的，我想絕大多數人腦海中會(huì )浮現出這樣的景象：他穿著(zhù)白大褂，聚精會(huì )神地坐在顯微鏡前觀(guān)察。這似乎已經(jīng)成了生物化學(xué)家的標準形象。然而有一天你去他辦公室，卻發(fā)現根本看不到顯微鏡和試管，只看到他穿著(zhù)寬大舒服的便裝，在電腦上噼里啪啦地敲代碼，這個(gè)景象必然會(huì )讓很多人大吃一驚。實(shí)際上，準確地說(shuō)，這位科學(xué)家是一位生物計算學(xué)家（或計算生物學(xué)家）。他的研究對象的確是像蛋白質(zhì)或者 DNA 這樣微小的生物活性物質(zhì)，但他和傳統的生物化學(xué)家不同的是，他的研究工具不是試管和顯微鏡，而是——計算機。

很多人在初次看到類(lèi)似“某某公司進(jìn)軍生物計算”這樣的新聞標題時(shí)，往往會(huì )產(chǎn)生強烈的不明覺(jué)厲的感覺(jué)。甚至有人以為是該公司要用生物活性物質(zhì)來(lái)制造計算機，就像科幻電影中出現的那種插滿(mǎn)電極的一攤軟乎乎的腦組織。

這真是一個(gè)天大的誤會(huì )。這些新聞其實(shí)說(shuō)的是：某公司要設計一種 AI 算法，它能夠根據有限的蛋白質(zhì)信息，準確地繪制出蛋白質(zhì)的三維結構。打個(gè)形象的比喻，這家公司相當于要幫助警察設計一個(gè)程序，它能根據受害人的描述，準確地繪制出兇手的外貌。繪制出某個(gè)蛋白質(zhì)的三維結構對于新藥研發(fā)，例如新冠病毒的疫苗研發(fā)有著(zhù)極其重大的意義。但是，這個(gè)問(wèn)題也極為困難，它是當今人類(lèi)科學(xué)面臨的幾個(gè)至關(guān)重要的挑戰之一。想要知道它難在哪里，又為什么意義重大，往下看。

蛋白質(zhì)折疊問(wèn)題

蛋白質(zhì)從微觀(guān)上來(lái)說(shuō)，就是一團有機大分子。它是構成生命的基本零件，每一種蛋白質(zhì)都有一個(gè)特定的三維結構，但這種三維結構有一個(gè)特殊之處：它一定是由一根長(cháng)長(cháng)的鏈條折疊而成的。要理解蛋白質(zhì)的三維結構到底是怎樣的，你只需要去玩一種叫“百變魔尺”的兒童玩具，就能馬上理解。百變魔尺是一節一節的，每一節都可以做各個(gè)角度的翻轉。因此，你可以把一根長(cháng)長(cháng)的魔尺折疊成各種各樣的形狀，魔尺的節數越多，能夠折疊出的形狀數量就會(huì )呈指數級的增長(cháng)。

組成蛋白質(zhì)的基本單元是氨基酸，它就像魔尺的一個(gè)“節”。蛋白質(zhì)剛剛生成時(shí)，就像一根長(cháng)長(cháng)的幾十到幾百節的魔尺。然后，它會(huì )在幾微秒到幾毫秒的時(shí)間內，迅速地折疊成一個(gè)特定的形狀。因此，在電子顯微鏡中，每一個(gè)蛋白質(zhì)就像是一團亂麻。

因此，決定一個(gè)蛋白質(zhì)性狀和功能的，就是構成蛋白質(zhì)的氨基酸序列和蛋白質(zhì)最終折疊成的形狀。比如，我們的免疫系統在面對病毒和細菌入侵時(shí)，就會(huì )產(chǎn)生一種“Y”字形的抗體蛋白。它們的形狀就像是一個(gè)抓娃娃機的夾子，能夠精確瞄準并夾住這些入侵者。

我們的韌帶、骨骼和皮膚之間有大量的膠原蛋白。它們的形狀就像是由三根粗繩擰成的麻花，為我們的皮膚提供張力，使其顯得有彈性。

再比如，2020 年獲得諾獎的基因定點(diǎn)編輯技術(shù) CRISPR，也正是利用了一個(gè)長(cháng)得像螃蟹鉗子的 CAS9 蛋白。它會(huì )“緊緊地夾住”基因組中某段特定的 DNA，從而進(jìn)行剪切。

因此，科學(xué)家們對蛋白質(zhì)最感興趣的是 2 個(gè)信息：一個(gè)是蛋白質(zhì)的氨基酸序列，你可以想象成魔尺的那些“節”；另一個(gè)則是蛋白質(zhì)的結構，也就是魔尺折疊后的形狀。序列信息相對容易獲得，但結構信息卻極難獲得。偏偏結構信息又更重要，因為知道了一個(gè)未知蛋白質(zhì)的結構，就可以更準確地理解它在細胞中的作用。如果這個(gè)蛋白質(zhì)與某種疾病相聯(lián)系，那么科學(xué)家們就能根據它的結構形狀，開(kāi)發(fā)出相應的藥物。1972 年，諾貝爾化學(xué)獎獲得者克里斯蒂安·安芬森提出了一個(gè)假說(shuō)：其實(shí)我們只需要知道一個(gè)信息就足夠了。因為他在實(shí)驗中發(fā)現，一個(gè)蛋白質(zhì)只要序列不發(fā)生改變，并且一直處于同一個(gè)化學(xué)環(huán)境中，那么它每次都能折疊成一樣的三維結構。所以，蛋白質(zhì)在三維空間中該如何折疊，這些信息其實(shí)已經(jīng)包含在了它的氨基酸序列中。換句話(huà)說(shuō)，如果我們知道了一個(gè)蛋白質(zhì)的氨基酸序列，理論上我們就應該能推測出它的三維結構。

安芬森的這個(gè)假說(shuō)得到了全世界同行的認可。然而科學(xué)家們很快就發(fā)現，好像知道了這個(gè)理論也沒(méi)什么用。雖然我們能在實(shí)驗室中相對容易地測出一個(gè)蛋白質(zhì)的氨基酸序列，但拿到這個(gè)序列，我們依然無(wú)法根據某條物理法則準確推測出它的三維結構。對此，科學(xué)家們已經(jīng)研究了將近 50 年，直到今天也沒(méi)有徹底弄清楚蛋白質(zhì)折疊的規律。這個(gè)問(wèn)題在生物化學(xué)界被稱(chēng)為“蛋白質(zhì)折疊問(wèn)題”，它是 21 世紀人類(lèi)科學(xué)面臨的幾大挑戰之一。

燒錢(qián)的產(chǎn)業(yè)

現在的科學(xué)家想要弄清楚一個(gè)蛋白質(zhì)的三維結構，唯一的辦法只能是耗費巨大的人力、物力，用極其笨拙的方法，通過(guò)大量的重復性實(shí)驗來(lái)找到蛋白質(zhì)的三維結構。需要的實(shí)驗設備如冷凍電鏡、X 射線(xiàn)晶體衍射儀、核磁共振儀等都價(jià)格昂貴。例如一臺冷凍電鏡的價(jià)格就高達數百萬(wàn)至幾千萬(wàn)人民幣。解析結構的過(guò)程是否順利有很大的運氣成分。運氣不好的時(shí)候，重復個(gè)上千次實(shí)驗都有可能出不來(lái)結果。因此，每解析一個(gè)蛋白質(zhì)結構，通常的成本在幾萬(wàn)到幾十萬(wàn)美元之間。

從上世紀末開(kāi)始，以 IBM 為首的一些計算機技術(shù)公司就提出了一個(gè)大膽的設想：可以通過(guò)蛋白質(zhì)的氨基酸序列，利用超級計算機來(lái)預測蛋白質(zhì)的三維結構。這相當于把原先在試管中進(jìn)行的實(shí)驗，轉移到電腦的數字空間中進(jìn)行。這個(gè)想法在當時(shí)非常大膽和前衛，因為它的運算量對于當時(shí)的計算機來(lái)說(shuō)是天文數字。你可能好奇：預測一個(gè)蛋白質(zhì)的折疊，怎么會(huì )需要海量的計算？粗略地說(shuō)，計算過(guò)程就好像在彩票箱中摸獎。一個(gè)擁有 100 個(gè)氨基酸的蛋白質(zhì)，你想象成是一個(gè)擁有 100 節的魔尺，它共可以產(chǎn)生約 10^94 次方種不同的形狀。這個(gè)數量已經(jīng)遠遠超過(guò)了整個(gè)宇宙中基本粒子的數量。計算機要做的事情其實(shí)就是排除法。根據一定的規則，先是一批批排除某類(lèi)絕對不可能的結構，然后再根據蛋白質(zhì)表現出來(lái)的性狀一個(gè)一個(gè)地排除。到了最后階段就像是不停地在一個(gè)巨大的彩票箱中抽獎，每抽一次都要耗費巨大的運算量。

IBM 用了 5 年的時(shí)間搞研發(fā)，終于在 2004 年宣布：世界上最大的超級電腦“藍色基因”（Blue Gene）問(wèn)世。它的主要目標就是解決蛋白質(zhì)折疊問(wèn)題。然而，事情進(jìn)展得并不像計算機專(zhuān)家們估計的那樣樂(lè )觀(guān)。10 年之后，藍色基因升級了三代，超級計算機也沒(méi)能取代試管、X 射線(xiàn)晶體衍射和核磁共振。IBM 也遺憾地終止了藍色基因系列的開(kāi)發(fā)。

不過(guò)，IBM 的失敗并不代表計算機模擬蛋白質(zhì)結構的失敗。恰恰相反，在 IBM 的帶動(dòng)下，參與這項挑戰的團隊越來(lái)越多，成果也越來(lái)越豐富。各種各樣奇妙的解題思路層出不窮，最好玩的例子是華盛頓大學(xué)的大衛·貝克（Davided Baker）教授的發(fā)明。

2008 年，他的團隊開(kāi)發(fā)出了一款名叫“Foldit”的解謎游戲。而這款解謎游戲的內容就是讓用戶(hù)憑借自己的直覺(jué)來(lái)折疊蛋白質(zhì)，然后根據一定的規則獲得分數。結果非常喜人，一個(gè)困擾了生物學(xué)家 15 年之久的猴類(lèi)艾滋病毒相關(guān)蛋白，作為謎題被上傳到游戲后，玩家們只用了 10 天就成功地破解了它最可能的折疊方式。

從 1994 年開(kāi)始，就誕生了一個(gè)名叫 CASP 的國際蛋白質(zhì)結構預測競賽。每?jì)赡昱e辦一次，參賽隊伍越來(lái)越多，全球的科技大佬云集。這個(gè)競賽中，裁判會(huì )給每個(gè)小組預測的結構進(jìn)行打分，滿(mǎn)分 100 分。在 2020 年 12 月結束的第 14 屆競賽中，傳來(lái)一個(gè)令人震驚的消息：曾經(jīng)開(kāi)發(fā)出著(zhù)名的圍棋程序 AlphaGo 的谷歌公司人工智能團隊，他們開(kāi)發(fā)的 AlphaFold 程序獲得冠軍，得到了 92.4 分。而上一屆同樣是冠軍的它，得分還不到 60 分，這種進(jìn)步的速度太令人震驚了。AlphaFold 預測的蛋白質(zhì)結構已經(jīng)非常接近于真實(shí)實(shí)驗做出來(lái)的結果，人類(lèi)離計算機攻克蛋白質(zhì)折疊問(wèn)題只有一步之遙。

中國理應入場(chǎng)

到此你對“生物計算”應該已經(jīng)有了一個(gè)初步的概念。不知道你發(fā)現沒(méi)，前文講了這么多，居然沒(méi)有一次提到中國。具有如此重要意義的一項科學(xué)事業(yè)，過(guò)去的幾十年基本上都是老外在玩兒，沒(méi)我們中國人什么事，這真的讓我感到揪心。對于未來(lái)的新藥研發(fā)、疫苗研發(fā)、精準醫療等等生物醫學(xué)技術(shù)，我幾乎可以肯定地說(shuō)：得生物計算者得天下。傳統的試管加電鏡式的研發(fā)模式，終將被 AI 所取代。這項科學(xué)研究事業(yè)，理應上升到國家戰略的高度。

亚洲一区二区三区免费,亚洲综合极品香蕉久久网,国产成人精欧美精品视频,怡红院色视频在线

亚洲一区二区三区免费,亚洲综合极品香蕉久久网,国产成人精欧美精品视频,怡红院色视频在线

“生物計算”是什么？為什么中國不能落后？

亚洲一区二区三区免费,亚洲综合极品香蕉久久网,国产成人精欧美精品视频,怡红院色视频在线

亚洲一区二区三区免费,亚洲综合极品香蕉久久网,国产成人精欧美精品视频,怡红院色视频在线

“生物計算”是什么？為什么中國不能落后？

“生物計算”是什么？為什么中國不能落后？