中文字幕日本人妻久久久免费_中文字幕久久久人妻无码_中文字幕在线观看_非洲黑人吊巨大vs亚洲女

芬蘭Kibron專注表面張力儀測量技術,快速精準測量動靜態表面張力

熱線:021-66110810,66110819,66110690,13564362870 Email: info@vizai.cn

當前位置首頁 > 新聞中心

使用深度學習方法高通量預測代謝酶的 kcat,或揭開細胞工廠秘密

來源:ScienceAI 瀏覽(lan) 682 次 發布時間:2022-09-14

酶周轉數(kcat)是了解細胞代謝、蛋白質(zhi)組分配(pei)和生理(li)多樣(yang)性(xing)的(de)關鍵,但實(shi)驗測(ce)量的(de)kcat數據往(wang)往(wang)稀疏且嘈雜。

查爾姆斯理工(gong)大學(Chalmers University of Technology)的研究(jiu)(jiu)團隊提供了一種(zhong)深度學習方(fang)法(DLKcat),用于僅根(gen)據(ju)底物結(jie)構和(he)蛋白質序列對來自任何生物體的代(dai)謝酶進(jin)行高通量kcat預(yu)測。DLKcat可(ke)以捕獲突(tu)變酶的kcat變化并識別對kcat值有(you)強烈影響的氨基酸殘(can)基。研究(jiu)(jiu)人員應(ying)用這(zhe)種(zhong)方(fang)法來預(yu)測300多種(zhong)酵母物種(zhong)的基因組規模kcat值。


此(ci)外,該團隊設計了(le)一個貝葉斯管道,以根據(ju)預測(ce)的(de)kcat值參數化酶(mei)(mei)約束的(de)基(ji)因組(zu)(zu)規模(mo)(mo)(mo)代(dai)(dai)謝模(mo)(mo)(mo)型(xing)(xing)(xing)。由此(ci)產生(sheng)的(de)模(mo)(mo)(mo)型(xing)(xing)(xing)在預測(ce)表(biao)型(xing)(xing)(xing)和(he)蛋白質(zhi)組(zu)(zu)方面優于先前管道中相應(ying)的(de)原始酶(mei)(mei)約束基(ji)因組(zu)(zu)規模(mo)(mo)(mo)代(dai)(dai)謝模(mo)(mo)(mo)型(xing)(xing)(xing),并使研究人員能夠解釋(shi)表(biao)型(xing)(xing)(xing)差(cha)異。DLKcat和(he)酶(mei)(mei)約束的(de)基(ji)因組(zu)(zu)規模(mo)(mo)(mo)代(dai)(dai)謝模(mo)(mo)(mo)型(xing)(xing)(xing)構建管道是揭示酶(mei)(mei)動(dong)力學(xue)和(he)生(sheng)理多樣性(xing)的(de)全球趨勢,并進一步闡明大規模(mo)(mo)(mo)細胞代(dai)(dai)謝的(de)寶貴工(gong)具。


該(gai)研究以「Deep learning-based kcat prediction enables improved enzyme-constrained model reconstruction」為題,于2022年6月(yue)16日發布在(zai)《Nature Catalysis》。

酶轉換數(shu)(shu)(kcat)定(ding)義了(le)反應的(de)(de)(de)最大(da)化學(xue)轉化率(lv),是(shi)了(le)解特定(ding)生(sheng)物體的(de)(de)(de)新陳(chen)代謝(xie)、蛋白質組分配、生(sheng)長和(he)生(sheng)理學(xue)的(de)(de)(de)關鍵參數(shu)(shu)。酶數(shu)(shu)據庫(ku)BRENDA和(he)SABIO-RK中(zhong)有(you)大(da)量可用的(de)(de)(de)kcat值集合(he),然而(er),與現有(you)的(de)(de)(de)各種生(sheng)物體和(he)代謝(xie)酶相比(bi),這(zhe)些值仍然稀少,這(zhe)主要是(shi)因為缺乏用于kcat測量的(de)(de)(de)高(gao)通量方法。


此外(wai),由于不同的(de)(de)測(ce)定條件(例如pH值、輔(fu)因子(zi)可用(yong)(yong)性和實驗(yan)方(fang)法),實驗(yan)測(ce)量的(de)(de)kcat值具(ju)有相當大的(de)(de)可變(bian)性。總(zong)之(zhi),稀疏的(de)(de)收(shou)集和相當大的(de)(de)噪聲限制了kcat數據在(zai)全局(ju)分析(xi)中(zhong)的(de)(de)使用(yong)(yong),并可能掩蓋酶(mei)進化趨勢。


特(te)別(bie)是酶(mei)約(yue)束的(de)(de)(de)基(ji)因組規(gui)模代謝模型(ecGEM),其中全細胞代謝網絡受到酶(mei)催(cui)化能力的(de)(de)(de)約(yue)束,因此能夠準確(que)模擬最大生(sheng)長能力、代謝變化和(he)蛋白質組分(fen)配,特(te)別(bie)依賴于(yu)基(ji)因組-縮放kcat值。在過去(qu)的(de)(de)(de)十年(nian)中,ecGEM(或(huo)遵循(xun)酶(mei)約(yue)束概念的(de)(de)(de)模型)已分(fen)別(bie)針對(dui)幾種經過充分(fen)研究的(de)(de)(de)生(sheng)物體開(kai)發(fa),包(bao)括大腸桿菌(jun)、釀酒酵(jiao)母、中國倉(cang)鼠卵(luan)巢細胞和(he)智人。由于(yu)kcat測量的(de)(de)(de)局限(xian)性(xing)和(he)依賴酶(mei)委員會(EC)編號注(zhu)釋來搜索這些已開(kai)發(fa)管(guan)道中的(de)(de)(de)kcat值,為(wei)(wei)研究較少(shao)的(de)(de)(de)生(sheng)物體重建ecGEM或(huo)為(wei)(wei)多種生(sheng)物體進行大規(gui)模重建仍然(ran)是一個挑戰。


此(ci)外,即使對于那些經過(guo)充分研究(jiu)的(de)(de)(de)(de)生物(wu)(wu),kcat的(de)(de)(de)(de)覆(fu)蓋范圍(wei)也遠未完成。在釀(niang)酒酵母(mu)ecGEM中,只有5%的(de)(de)(de)(de)酶促反應在BRENDA中具有完全匹配的(de)(de)(de)(de)kcat值(zhi)。當數(shu)據缺失時,以前的(de)(de)(de)(de)ecGEM重建流程通常(chang)假設kcat值(zhi)來自類似的(de)(de)(de)(de)底物(wu)(wu)、反應或(huo)其他生物(wu)(wu),這可能(neng)導致模(mo)(mo)型(xing)預(yu)測偏離(li)實驗觀(guan)察。明確要(yao)求獲得(de)大規模(mo)(mo)的(de)(de)(de)(de)kcat值(zhi)以提高模(mo)(mo)型(xing)準(zhun)確性并產生更可靠(kao)的(de)(de)(de)(de)表型(xing)模(mo)(mo)擬。


深度學習已被應用并在模擬化(hua)學空間、基因表達、酶(mei)相關參數(shu)(shu)(如酶(mei)親和力和EC數(shu)(shu))方(fang)面表現出出色的(de)性能(neng)。此前,有(you)研究(jiu)人員采用機器(qi)學習方(fang)法,根據(ju)從蛋(dan)白質結構中獲(huo)得(de)的(de)平均代謝通(tong)量和催化(hua)位點等特征(zheng)來(lai)預測(ce)大(da)腸(chang)桿(gan)菌(jun)kcat值。然而,這些特征(zheng)通(tong)常很(hen)難獲(huo)得(de),這使得(de)這種方(fang)法只能(neng)應用于(yu)研究(jiu)最(zui)充分的(de)生(sheng)物(wu)體,如大(da)腸(chang)桿(gan)菌(jun)。


在(zai)這里(li),查爾姆(mu)斯理工大(da)學(xue)(Chalmers University of Technology)的(de)(de)研究團隊提出了深度學(xue)習方法DLKcat來預測(ce)所有代(dai)謝酶(mei)與其底(di)物(wu)的(de)(de)kcat值(zhi),只需要(yao)底(di)物(wu)SMILES信息(xi)和酶(mei)的(de)(de)蛋白質序列作為輸入,從(cong)而為任何物(wu)種產生通用的(de)(de)kcat預測(ce)工具(ju)。

圖(tu)示:用于ecGEM參數化的kcat深度(du)學習。(來(lai)源:論文)


DLKcat可以(yi)捕(bu)獲kcat向精(jing)確的(de)單個氨(an)基(ji)(ji)酸(suan)替(ti)代(dai)方向的(de)變化(hua)(hua)(hua),從而能夠計算注意(yi)力權重(zhong)(zhong),從而識別對(dui)酶活(huo)性產生重(zhong)(zhong)大影響(xiang)的(de)氨(an)基(ji)(ji)酸(suan)殘(can)基(ji)(ji)。氨(an)基(ji)(ji)酸(suan)取代(dai)是(shi)酶進(jin)化(hua)(hua)(hua)領域(yu)的(de)一項強大技術,通(tong)常用于探測酶催化(hua)(hua)(hua)機制。特別是(shi),大多數替(ti)代(dai)實驗在底(di)物結合位點區(qu)(qu)域(yu)進(jin)行(xing)誘變,因為假設結合區(qu)(qu)域(yu)將對(dui)催化(hua)(hua)(hua)活(huo)性產生很大影響(xiang)。然而,據報道,偏遠地區(qu)(qu)會對(dui)催化(hua)(hua)(hua)活(huo)性產生深(shen)遠影響(xiang)。


研究人員不僅確(que)定了(le)人PNP酶肌苷結合(he)區域中氨基(ji)酸殘基(ji)的(de)高(gao)關注(zhu)(zhu)權(quan)重,而且還確(que)定了(le)具有高(gao)關注(zhu)(zhu)權(quan)重的(de)各種非結合(he)殘基(ji)位(wei)點(dian),這表明這些殘基(ji)也可能(neng)對催化活性產生重大(da)影響(xiang),值(zhi)得(de)進一步驗(yan)證。DLKcat因(yin)此可以作為蛋白質工(gong)程(cheng)工(gong)具箱的(de)重要組成部分。


預測的(de)基因(yin)組規模的(de)kcat譜可以促進酶(mei)約束代謝模型(xing)的(de)重(zhong)建,從策劃和(he)自動生成的(de)基本(非ec)GEM中(zhong)。事實證明,深度學習預測的(de)kcat過程(cheng)比匹配來自BRENDA和(he)SABIO-RK數據庫(ku)的(de)體外kcat值更全(quan)面但仍然實用;這在GECKO和(he)MOMENT等原始ecGEM重(zhong)建管道(dao)中(zhong)很(hen)常見(jian)。


通過不依賴EC編(bian)號注釋,DLKcat還能夠預測同工酶(mei)特異性kcat值(zhi)(zhi),而SMILES的(de)(de)(de)使用(yong)避免了原始ecGEM重(zhong)建管道(dao)(dao)可(ke)能遇到的(de)(de)(de)GEM和BRENDA之間底物命名不統一的(de)(de)(de)問題。隨(sui)后可(ke)以通過貝(bei)葉斯方(fang)法(fa)(fa)將DL-ecGEM調整為現有(you)的(de)(de)(de)實(shi)驗生長數據,該方(fang)法(fa)(fa)產生具有(you)生理相關解(jie)空間的(de)(de)(de)后均值(zhi)(zhi)ecGEM。結合起來,當前(qian)基(ji)于DLKcat的(de)(de)(de)管道(dao)(dao)因此適用(yong)于幾乎(hu)任何生物體的(de)(de)(de)ecGEM重(zhong)建,其中蛋白質序列FASTA文(wen)件和基(ji)本GEM可(ke)用(yong)。他們(men)的(de)(de)(de)管道(dao)(dao)因此提高了適用(yong)性,與以前(qian)構建的(de)(de)(de)原始ecGEM相比,它甚至提高了具有(you)酶(mei)促約束的(de)(de)(de)反(fan)應(ying)數量。

圖示:kcat預測的(de)深度學習模型性能。(來源:論文)


盡(jin)管(guan)基于DLKcat的(de)管(guan)道(dao)產(chan)生的(de)ecGEM性能優于原始ecGEM,但仍(reng)(reng)然(ran)(ran)存(cun)在各種挑(tiao)戰(zhan)。例(li)如,雖然(ran)(ran)深度學(xue)習(xi)模(mo)型可(ke)以(yi)將混(hun)雜酶的(de)替代物(wu)(wu)與隨機(ji)選擇的(de)底物(wu)(wu)區(qu)分開來,但它仍(reng)(reng)然(ran)(ran)預測(ce)了可(ke)能過高的(de)隨機(ji)底物(wu)(wu)的(de)動力學(xue)活性水平。


這種(zhong)行為(wei)可(ke)以(yi)通過負面數據(ju)的(de)有限可(ke)用性來(lai)解釋:酶-底(di)物(wu)對(dui)沒(mei)有產生催化作用的(de)情況。增加對(dui)陰(yin)性數據(ju)集(ji)的(de)報告(gao),其中(zhong)酶-底(di)物(wu)對(dui)的(de)未(wei)檢(jian)測到的(de)活(huo)性由(you)酶數據(ju)庫報告(gao)和(he)收(shou)集(ji),可(ke)以(yi)增強(qiang)未(wei)來(lai)深(shen)度學習模型在(zai)定義(yi)真陰(yin)性方面的(de)能力。


此外,DLKcat并未考慮pH和溫(wen)度(du)等環(huan)境(jing)(jing)因(yin)素(su)的(de)影響,但(dan)將DLKcat與其他新(xin)興機器學(xue)習工具(例(li)如酶(mei)的(de)最(zui)佳溫(wen)度(du)預測)相結合,將有助于(yu)未來研究(jiu)環(huan)境(jing)(jing)參(can)數對酶(mei)活性的(de)影響。


另一個(ge)挑戰涉及涉及多(duo)(duo)種(zhong)(zhong)底(di)物和(he)由異(yi)聚酶(mei)(mei)復合物催化(hua)的(de)反(fan)(fan)應(ying)(ying)。可以(yi)(yi)為此類反(fan)(fan)應(ying)(ying)定義的(de)多(duo)(duo)底(di)物SMILES和(he)蛋(dan)白質序列都可以(yi)(yi)與DLKcat一起發(fa)揮(hui)作用(yong),從而為一個(ge)反(fan)(fan)應(ying)(ying)產生多(duo)(duo)個(ge)預(yu)測(ce)的(de)kcat值。目前在這些(xie)情況下,研究(jiu)人員(yuan)會選擇最大kcat值,但最好設(she)計一種(zhong)(zhong)方法來預(yu)測(ce)每種(zhong)(zhong)多(duo)(duo)底(di)物和(he)異(yi)聚酶(mei)(mei)的(de)一個(ge)kcat值。

圖(tu)示:用于預測和解釋突變(bian)酶kcat的深(shen)度學習模(mo)型。(來源:論文)


此外,DLKcat衍生的(de)DL-ecGEM和(he)(he)后驗(yan)均(jun)值ecGEM繼承了(le)基本GEM的(de)局(ju)限性,其中基于(yu)約束(shu)的(de)建(jian)模的(de)核心(xin)穩態假(jia)設允許人(ren)們確定代(dai)謝(xie)通(tong)量,但(dan)不(bu)容易考慮調節(jie)行為(wei)。雖然ecGEM極大地將基于(yu)約束(shu)的(de)模型的(de)解空間減少到細胞可(ke)行容量,但(dan)kcat并不(bu)是決定反應速率的(de)唯一動力(li)學參數(shu),例如,親和(he)(he)常數(shu)起著重要的(de)作用。然而,由于(yu)基于(yu)約束(shu)的(de)模型無(wu)法預測內部(bu)代(dai)謝(xie)物濃度,因此目前無(wu)法輕易考慮這些(xie)參數(shu)的(de)影(ying)響(xiang)。


盡管如(ru)(ru)此,kcat值也(ye)(ye)是其他資源分(fen)配(pei)(pei)(pei)模(mo)型(xing)(xing)中(zhong)的(de)(de)重要參數,例如(ru)(ru)蛋白(bai)(bai)質(zhi)組約(yue)束的(de)(de)GEM和代謝/大分(fen)子表(biao)達模(mo)型(xing)(xing)。盡管改(gai)進的(de)(de)預測和更多的(de)(de)應(ying)用,如(ru)(ru)何(he)定義kcat值也(ye)(ye)仍然是重建這些模(mo)型(xing)(xing)的(de)(de)挑戰。這種資源分(fen)配(pei)(pei)(pei)模(mo)型(xing)(xing)和ecGEM都(dou)認為細胞需要將(jiang)其有限的(de)(de)蛋白(bai)(bai)質(zhi)組分(fen)配(pei)(pei)(pei)到不同的(de)(de)途(tu)徑以實現更快的(de)(de)生長或更好(hao)的(de)(de)適應(ying)度,而每(mei)個反應(ying)的(de)(de)蛋白(bai)(bai)質(zhi)組成本同樣由酶的(de)(de)通量和動力學速率定義。


因此,這些(xie)模型(xing)的(de)代謝(xie)部分的(de)深度學(xue)(xue)習預(yu)測(ce)kcat值可(ke)以提高其質量和性能,盡管(guan)無法從DLKcat獲(huo)得在這些(xie)模型(xing)公式(shi)(shi)中確定的(de)其他具有挑戰性的(de)動力學(xue)(xue)參數,例如(ru)核(he)糖體催化率。此外(wai),特別關注描述酶動力學(xue)(xue)的(de)模型(xing)公式(shi)(shi)可(ke)以受益于深度學(xue)(xue)習預(yu)測(ce)的(de)kcat值,因此DLKcat方法可(ke)以在建(jian)模領域找到廣泛的(de)應用(yong)。


總之,DLKcat產生了現實的(de)kcat值,可(ke)用于指導(dao)未來的(de)基(ji)因(yin)(yin)工程、了解酶進化(hua)和(he)(he)重建(jian)(jian)ecGEM以(yi)預(yu)測代謝(xie)通量和(he)(he)表型。除此之外,這種基(ji)于深度學(xue)習的(de)kcat預(yu)測工具的(de)許多(duo)其他潛(qian)在用途,例如基(ji)因(yin)(yin)組(zu)(zu)挖掘和(he)(he)全基(ji)因(yin)(yin)組(zu)(zu)關(guan)聯研究分析(xi)(xi)中(zhong)的(de)工具。開(kai)發(fa)的(de)自動貝葉斯ecGEM重建(jian)(jian)管道(dao)將有助于進一步用于ecGEM重建(jian)(jian),用于組(zu)(zu)學(xue)數據合并和(he)(he)分析(xi)(xi)。


論文鏈接://www.nature.com/articles/s41929-022-00798-z