日韩av无码中文字幕,国产午夜亚洲精品国产成人小说,成人影院午夜男女爽爽爽,欧美 亚洲 中文 国产 综合

首頁 熱點 要聞 國內(nèi) 產(chǎn)業(yè) 財經(jīng) 滾動 理財 股票

利用ChatGPT背后的AI加速藥物發(fā)現(xiàn) - 每天可篩選1億種化合物

2023-06-21 19:38:34 來源 : cnBeta

通過將語言模型應(yīng)用于蛋白質(zhì)與藥物的相互作用,研究人員可以快速篩選大量的潛在藥物化合物庫。巨大的藥物化合物庫可能擁有治療各種疾病的潛力,如癌癥或心臟病。理想情況下,科學(xué)家們希望通過實驗對這些化合物中的每一種針對所有可能的目標(biāo)進(jìn)行測試,但進(jìn)行這樣的篩選是非常耗時的。


【資料圖】

近年來,研究人員已經(jīng)開始使用計算方法來篩選這些化合物庫,希望能加快藥物發(fā)現(xiàn)的速度。然而,其中許多方法也需要很長的時間,因為它們中的大多數(shù)都是從氨基酸序列中計算出每個目標(biāo)蛋白的三維結(jié)構(gòu),然后用這些結(jié)構(gòu)來預(yù)測它將與哪些藥物分子相互作用。

麻省理工學(xué)院和塔夫茨大學(xué)的研究人員現(xiàn)在已經(jīng)設(shè)計出一種基于一種被稱為大型語言模型的人工智能算法的替代計算方法。這些模型--一個著名的例子是ChatGPT--可以分析大量的文本,并找出哪些詞(或者,在這種情況下是氨基酸)最有可能一起出現(xiàn)。這個被稱為ConPLex的新模型可以將目標(biāo)蛋白質(zhì)與潛在的藥物分子相匹配,而不必執(zhí)行計算分子結(jié)構(gòu)的密集步驟。

使用這種方法,研究人員可以在一天內(nèi)篩選出超過1億個化合物--比任何現(xiàn)有模型都要多。

麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實驗室(CSAIL)計算與生物學(xué)組組長、西蒙斯數(shù)學(xué)教授邦尼-伯杰(Bonnie Berger)說:"這項工作解決了對潛在候選藥物進(jìn)行高效和準(zhǔn)確的硅計算篩選的需求,而且該模型的可擴(kuò)展性使得大規(guī)模篩選可以評估脫靶效應(yīng)、藥物再利用以及確定突變對藥物結(jié)合的影響。"

塔夫茨大學(xué)計算機(jī)科學(xué)教授Lenore Cowen也是該論文的資深作者,該論文于6月8日發(fā)表在《美國國家科學(xué)院院刊》上。CSAIL的研究科學(xué)家Rohit Singh和麻省理工學(xué)院的研究生Samuel Sledzieski是這篇論文的主要作者,麻省理工學(xué)院生物工程副教授、麻省理工學(xué)院和哈佛大學(xué)Ragon研究所成員Bryan Bryson也是作者。除了這篇論文,研究人員還在網(wǎng)上提供了他們的模型供其他科學(xué)家使用。

進(jìn)行預(yù)測

近年來,計算科學(xué)家在開發(fā)能夠根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測其結(jié)構(gòu)的模型方面取得了巨大的進(jìn)展。然而,使用這些模型來預(yù)測大型潛在藥物庫如何與一個癌癥蛋白質(zhì)相互作用,例如,已被證明具有挑戰(zhàn)性,主要是因為計算蛋白質(zhì)的三維結(jié)構(gòu)需要大量的時間和計算能力。

另一個障礙是,這類模型在消除被稱為誘餌的化合物方面沒有良好的記錄,這些誘餌與成功的藥物非常相似,但實際上并不能與目標(biāo)發(fā)生良好的互動。

Singh說:"該領(lǐng)域的一個長期挑戰(zhàn)是這些方法是脆弱的,也就是說,如果我給模型一種藥物或一種小分子,看起來幾乎像真正的東西,但它在某些微妙的方面略有不同,該模型可能仍然預(yù)測它們會相互作用,盡管它不應(yīng)該。"

研究人員已經(jīng)設(shè)計出了能夠克服這種脆弱性的模型,但它們通常只針對一類藥物分子,而且由于計算時間過長,它們并不適合大規(guī)模篩選。

麻省理工學(xué)院的團(tuán)隊決定采取另一種方法,基于他們在2019年首次開發(fā)的一個蛋白質(zhì)模型。與一個包含2萬多個蛋白質(zhì)的數(shù)據(jù)庫合作,該語言模型將這些信息編碼為每個氨基酸序列的有意義的數(shù)字表示,這些數(shù)字表示捕捉了序列和結(jié)構(gòu)之間的關(guān)聯(lián)。

Sledzieski說:"有了這些語言模型,即使是序列非常不同但可能具有類似結(jié)構(gòu)或類似功能的蛋白質(zhì)也可以在這個語言空間中以類似的方式表示,我們能夠利用這一點來進(jìn)行預(yù)測。"

在他們的新研究中,研究人員將蛋白質(zhì)模型應(yīng)用于找出哪些蛋白質(zhì)序列將與特定藥物分子相互作用的任務(wù),兩者都有數(shù)字表示,通過神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)化為一個共同的共享空間。他們對已知的蛋白質(zhì)-藥物相互作用進(jìn)行了訓(xùn)練,這使得它能夠?qū)W會將蛋白質(zhì)的具體特征與藥物結(jié)合能力聯(lián)系起來,而不必計算任何分子的三維結(jié)構(gòu)。

"有了這種高質(zhì)量的數(shù)字表示,該模型可以完全繞過原子表示,并從這些數(shù)字中預(yù)測這種藥物是否會結(jié)合,"Singh說。"這樣做的好處是,你避免了通過原子表示法的需要,但這些數(shù)字仍然有你需要的所有信息。"

這種方法的另一個優(yōu)點是,它考慮到了蛋白質(zhì)結(jié)構(gòu)的靈活性,當(dāng)與藥物分子相互作用時,蛋白質(zhì)結(jié)構(gòu)可能是"搖擺不定"的,并呈現(xiàn)出略微不同的形狀。

高親和力

為了使他們的模型不太可能被誘餌藥物分子所愚弄,研究人員還納入了一個基于對比學(xué)習(xí)概念的訓(xùn)練階段。在這種方法下,研究人員給模型提供了"真實"藥物和誘餌的例子,并教它區(qū)分它們。

然后,研究人員通過篩選大約4700個候選藥物分子庫來測試他們的模型,看它們是否能與一組被稱為蛋白激酶的51種酶結(jié)合。

研究人員從排名靠前的藥物中選擇了19個藥物-蛋白對進(jìn)行實驗測試。實驗顯示,在這19個命題中,有12個具有很強(qiáng)的結(jié)合親和力(在納摩爾范圍內(nèi)),而幾乎所有其他可能的藥物-蛋白質(zhì)配對都沒有親和力。這些配對中的四個以極高的、亞納摩爾的親和力結(jié)合(如此之強(qiáng),以至于極小的藥物濃度,即十億分之一,就能抑制該蛋白質(zhì))。

雖然研究人員在這項研究中主要側(cè)重于篩選小分子藥物,但他們現(xiàn)在正致力于將這種方法應(yīng)用于其他類型的藥物,如治療性抗體。這種建模也可以證明對潛在的藥物化合物進(jìn)行毒性篩選是有用的,以確保它們在動物模型中測試之前沒有任何不必要的副作用。

"藥物發(fā)現(xiàn)如此昂貴的部分原因是它有很高的失敗率。"Singh說:"如果我們能夠通過預(yù)先說這種藥物不可能成功來減少這些失敗率,這可以在很大程度上降低藥物發(fā)現(xiàn)的成本。"

美國國家癌癥研究所癌癥數(shù)據(jù)科學(xué)實驗室主任Eytan Ruppin說,這種新方法"代表了藥物-靶點相互作用預(yù)測的重大突破,并為未來的研究提供了更多機(jī)會,以進(jìn)一步提高其能力",他并沒有參與這項研究。"例如,將結(jié)構(gòu)信息納入潛伏空間或探索生成誘餌的分子生成方法可以進(jìn)一步改善預(yù)測。"

關(guān)鍵詞:
相關(guān)文章

最近更新
精彩推送