新聞中心Info

> 公司新聞

> 行業資訊

> 產品百科

合作客戶/

拜耳公司.jpg

拜耳公司

同濟大學

聯合大學.jpg

聯合大學

寶潔公司

美國保潔

強生=

美國強生

瑞士羅氏

使用深度學習方法高通量預測代謝酶的 kcat，或揭開細胞工廠秘密

來源：ScienceAI 瀏覽(lan) 682 次發布時間:2022-09-14

酶周轉數（kcat）是了解細胞代謝、蛋白質(zhi)組分配(pei)和生理(li)多樣(yang)性(xing)的(de)關鍵，但實(shi)驗測(ce)量的(de)kcat數據往(wang)往(wang)稀疏且嘈雜。

查爾姆斯理工(gong)大學（Chalmers University of Technology）的研究(jiu)(jiu)團隊提供了一種(zhong)深度學習方(fang)法（DLKcat），用于僅根(gen)據(ju)底物結(jie)構和(he)蛋白質序列對來自任何生物體的代(dai)謝酶進(jin)行高通量kcat預(yu)測。DLKcat可(ke)以捕獲突(tu)變酶的kcat變化并識別對kcat值有(you)強烈影響的氨基酸殘(can)基。研究(jiu)(jiu)人員應(ying)用這(zhe)種(zhong)方(fang)法來預(yu)測300多種(zhong)酵母物種(zhong)的基因組規模kcat值。

此(ci)外，該團隊設計了(le)一個貝葉斯管道，以根據(ju)預測(ce)的(de)kcat值參數化酶(mei)(mei)約束的(de)基(ji)因組(zu)(zu)規模(mo)(mo)(mo)代(dai)(dai)謝模(mo)(mo)(mo)型(xing)(xing)(xing)。由此(ci)產生(sheng)的(de)模(mo)(mo)(mo)型(xing)(xing)(xing)在預測(ce)表(biao)型(xing)(xing)(xing)和(he)蛋白質(zhi)組(zu)(zu)方面優于先前管道中相應(ying)的(de)原始酶(mei)(mei)約束基(ji)因組(zu)(zu)規模(mo)(mo)(mo)代(dai)(dai)謝模(mo)(mo)(mo)型(xing)(xing)(xing)，并使研究人員能夠解釋(shi)表(biao)型(xing)(xing)(xing)差(cha)異。DLKcat和(he)酶(mei)(mei)約束的(de)基(ji)因組(zu)(zu)規模(mo)(mo)(mo)代(dai)(dai)謝模(mo)(mo)(mo)型(xing)(xing)(xing)構建管道是揭示酶(mei)(mei)動(dong)力學(xue)和(he)生(sheng)理多樣性(xing)的(de)全球趨勢，并進一步闡明大規模(mo)(mo)(mo)細胞代(dai)(dai)謝的(de)寶貴工(gong)具。

該(gai)研究以「Deep learning-based kcat prediction enables improved enzyme-constrained model reconstruction」為題，于2022年6月(yue)16日發布在(zai)《Nature Catalysis》。

酶轉換數(shu)(shu)（kcat）定(ding)義了(le)反應的(de)(de)(de)最大(da)化學(xue)轉化率(lv)，是(shi)了(le)解特定(ding)生(sheng)物體的(de)(de)(de)新陳(chen)代謝(xie)、蛋白質組分配、生(sheng)長和(he)生(sheng)理學(xue)的(de)(de)(de)關鍵參數(shu)(shu)。酶數(shu)(shu)據庫(ku)BRENDA和(he)SABIO-RK中(zhong)有(you)大(da)量可用的(de)(de)(de)kcat值集合(he)，然而(er)，與現有(you)的(de)(de)(de)各種生(sheng)物體和(he)代謝(xie)酶相比(bi)，這(zhe)些值仍然稀少，這(zhe)主要是(shi)因為缺乏用于kcat測量的(de)(de)(de)高(gao)通量方法。

此外(wai)，由于不同的(de)(de)測(ce)定條件（例如pH值、輔(fu)因子(zi)可用(yong)(yong)性和實驗(yan)方(fang)法），實驗(yan)測(ce)量的(de)(de)kcat值具(ju)有相當大的(de)(de)可變(bian)性。總(zong)之(zhi)，稀疏的(de)(de)收(shou)集和相當大的(de)(de)噪聲限制了kcat數據在(zai)全局(ju)分析(xi)中(zhong)的(de)(de)使用(yong)(yong)，并可能掩蓋酶(mei)進化趨勢。

特(te)別(bie)是酶(mei)約(yue)束的(de)(de)(de)基(ji)因組規(gui)模代謝模型（ecGEM），其中全細胞代謝網絡受到酶(mei)催(cui)化能力的(de)(de)(de)約(yue)束，因此能夠準確(que)模擬最大生(sheng)長能力、代謝變化和(he)蛋白質組分(fen)配，特(te)別(bie)依賴于(yu)基(ji)因組-縮放kcat值。在過去(qu)的(de)(de)(de)十年(nian)中，ecGEM（或(huo)遵循(xun)酶(mei)約(yue)束概念的(de)(de)(de)模型）已分(fen)別(bie)針對(dui)幾種經過充分(fen)研究的(de)(de)(de)生(sheng)物體開(kai)發(fa)，包(bao)括大腸桿菌(jun)、釀酒酵(jiao)母、中國倉(cang)鼠卵(luan)巢細胞和(he)智人。由于(yu)kcat測量的(de)(de)(de)局限(xian)性(xing)和(he)依賴酶(mei)委員會（EC）編號注(zhu)釋來搜索這些已開(kai)發(fa)管(guan)道中的(de)(de)(de)kcat值，為(wei)(wei)研究較少(shao)的(de)(de)(de)生(sheng)物體重建ecGEM或(huo)為(wei)(wei)多種生(sheng)物體進行大規(gui)模重建仍然(ran)是一個挑戰。

此(ci)外，即使對于那些經過(guo)充分研究(jiu)的(de)(de)(de)(de)生物(wu)(wu)，kcat的(de)(de)(de)(de)覆(fu)蓋范圍(wei)也遠未完成。在釀(niang)酒酵母(mu)ecGEM中，只有5%的(de)(de)(de)(de)酶促反應在BRENDA中具有完全匹配的(de)(de)(de)(de)kcat值(zhi)。當數(shu)據缺失時，以前的(de)(de)(de)(de)ecGEM重建流程通常(chang)假設kcat值(zhi)來自類似的(de)(de)(de)(de)底物(wu)(wu)、反應或(huo)其他生物(wu)(wu)，這可能(neng)導致模(mo)(mo)型(xing)預(yu)測偏離(li)實驗觀(guan)察。明確要(yao)求獲得(de)大規模(mo)(mo)的(de)(de)(de)(de)kcat值(zhi)以提高模(mo)(mo)型(xing)準(zhun)確性并產生更可靠(kao)的(de)(de)(de)(de)表型(xing)模(mo)(mo)擬。

深度學習已被應用并在模擬化(hua)學空間、基因表達、酶(mei)相關參數(shu)(shu)（如酶(mei)親和力和EC數(shu)(shu)）方(fang)面表現出出色的(de)性能(neng)。此前，有(you)研究(jiu)人員采用機器(qi)學習方(fang)法，根據(ju)從蛋(dan)白質結構中獲(huo)得(de)的(de)平均代謝通(tong)量和催化(hua)位點等特征(zheng)來(lai)預測(ce)大(da)腸(chang)桿(gan)菌(jun)kcat值。然而，這些特征(zheng)通(tong)常很(hen)難獲(huo)得(de)，這使得(de)這種方(fang)法只能(neng)應用于(yu)研究(jiu)最(zui)充分的(de)生(sheng)物(wu)體，如大(da)腸(chang)桿(gan)菌(jun)。

在(zai)這里(li)，查爾姆(mu)斯理工大(da)學(xue)（Chalmers University of Technology）的(de)(de)研究團隊提出了深度學(xue)習方法DLKcat來預測(ce)所有代(dai)謝酶(mei)與其底(di)物(wu)的(de)(de)kcat值(zhi)，只需要(yao)底(di)物(wu)SMILES信息(xi)和酶(mei)的(de)(de)蛋白質序列作為輸入，從(cong)而為任何物(wu)種產生通用的(de)(de)kcat預測(ce)工具(ju)。

圖(tu)示：用于ecGEM參數化的kcat深度(du)學習。（來(lai)源：論文）

DLKcat可以(yi)捕(bu)獲kcat向精(jing)確的(de)單個氨(an)基(ji)(ji)酸(suan)替(ti)代(dai)方向的(de)變化(hua)(hua)(hua)，從而能夠計算注意(yi)力權重(zhong)(zhong)，從而識別對(dui)酶活(huo)性產生重(zhong)(zhong)大影響(xiang)的(de)氨(an)基(ji)(ji)酸(suan)殘(can)基(ji)(ji)。氨(an)基(ji)(ji)酸(suan)取代(dai)是(shi)酶進(jin)化(hua)(hua)(hua)領域(yu)的(de)一項強大技術，通(tong)常用于探測酶催化(hua)(hua)(hua)機制。特別是(shi)，大多數替(ti)代(dai)實驗在底(di)物結合位點區(qu)(qu)域(yu)進(jin)行(xing)誘變，因為假設結合區(qu)(qu)域(yu)將對(dui)催化(hua)(hua)(hua)活(huo)性產生很大影響(xiang)。然而，據報道，偏遠地區(qu)(qu)會對(dui)催化(hua)(hua)(hua)活(huo)性產生深(shen)遠影響(xiang)。

研究人員不僅確(que)定了(le)人PNP酶肌苷結合(he)區域中氨基(ji)酸殘基(ji)的(de)高(gao)關注(zhu)(zhu)權(quan)重，而且還確(que)定了(le)具有高(gao)關注(zhu)(zhu)權(quan)重的(de)各種非結合(he)殘基(ji)位(wei)點(dian)，這表明這些殘基(ji)也可能(neng)對催化活性產生重大(da)影響(xiang)，值(zhi)得(de)進一步驗(yan)證。DLKcat因(yin)此可以作為蛋白質工(gong)程(cheng)工(gong)具箱的(de)重要組成部分。

預測的(de)基因(yin)組規模的(de)kcat譜可以促進酶(mei)約束代謝模型(xing)的(de)重(zhong)建，從策劃和(he)自動生成的(de)基本（非ec）GEM中(zhong)。事實證明，深度學習預測的(de)kcat過程(cheng)比匹配來自BRENDA和(he)SABIO-RK數據庫(ku)的(de)體外kcat值更全(quan)面但仍然實用；這在GECKO和(he)MOMENT等原始ecGEM重(zhong)建管道(dao)中(zhong)很(hen)常見(jian)。

通過不依賴EC編(bian)號注釋，DLKcat還能夠預測同工酶(mei)特異性kcat值(zhi)(zhi)，而SMILES的(de)(de)(de)使用(yong)避免了原始ecGEM重(zhong)建管道(dao)(dao)可(ke)能遇到的(de)(de)(de)GEM和BRENDA之間底物命名不統一的(de)(de)(de)問題。隨(sui)后可(ke)以通過貝(bei)葉斯方(fang)法(fa)(fa)將DL-ecGEM調整為現有(you)的(de)(de)(de)實(shi)驗生長數據，該方(fang)法(fa)(fa)產生具有(you)生理相關解(jie)空間的(de)(de)(de)后均值(zhi)(zhi)ecGEM。結合起來，當前(qian)基(ji)于DLKcat的(de)(de)(de)管道(dao)(dao)因此適用(yong)于幾乎(hu)任何生物體的(de)(de)(de)ecGEM重(zhong)建，其中蛋白質序列FASTA文(wen)件和基(ji)本GEM可(ke)用(yong)。他們(men)的(de)(de)(de)管道(dao)(dao)因此提高了適用(yong)性，與以前(qian)構建的(de)(de)(de)原始ecGEM相比，它甚至提高了具有(you)酶(mei)促約束的(de)(de)(de)反(fan)應(ying)數量。

圖示：kcat預測的(de)深度學習模型性能。（來源：論文）

盡(jin)管(guan)基于DLKcat的(de)管(guan)道(dao)產(chan)生的(de)ecGEM性能優于原始ecGEM，但仍(reng)(reng)然(ran)(ran)存(cun)在各種挑(tiao)戰(zhan)。例(li)如，雖然(ran)(ran)深度學(xue)習(xi)模(mo)型可(ke)以(yi)將混(hun)雜酶的(de)替代物(wu)(wu)與隨機(ji)選擇的(de)底物(wu)(wu)區(qu)分開來，但它仍(reng)(reng)然(ran)(ran)預測(ce)了可(ke)能過高的(de)隨機(ji)底物(wu)(wu)的(de)動力學(xue)活性水平。

這種(zhong)行為(wei)可(ke)以(yi)通過負面數據(ju)的(de)有限可(ke)用性來(lai)解釋：酶-底(di)物(wu)對(dui)沒(mei)有產生催化作用的(de)情況。增加對(dui)陰(yin)性數據(ju)集(ji)的(de)報告(gao)，其中(zhong)酶-底(di)物(wu)對(dui)的(de)未(wei)檢(jian)測到的(de)活(huo)性由(you)酶數據(ju)庫報告(gao)和(he)收(shou)集(ji)，可(ke)以(yi)增強(qiang)未(wei)來(lai)深(shen)度學習模型在(zai)定義(yi)真陰(yin)性方面的(de)能力。

此外，DLKcat并未考慮pH和溫(wen)度(du)等環(huan)境(jing)(jing)因(yin)素(su)的(de)影響，但(dan)將DLKcat與其他新(xin)興機器學(xue)習工具（例(li)如酶(mei)的(de)最(zui)佳溫(wen)度(du)預測）相結合，將有助于(yu)未來研究(jiu)環(huan)境(jing)(jing)參(can)數對酶(mei)活性的(de)影響。

另一個(ge)挑戰涉及涉及多(duo)(duo)種(zhong)(zhong)底(di)物和(he)由異(yi)聚酶(mei)(mei)復合物催化(hua)的(de)反(fan)(fan)應(ying)(ying)。可以(yi)(yi)為此類反(fan)(fan)應(ying)(ying)定義的(de)多(duo)(duo)底(di)物SMILES和(he)蛋(dan)白質序列都可以(yi)(yi)與DLKcat一起發(fa)揮(hui)作用(yong)，從而為一個(ge)反(fan)(fan)應(ying)(ying)產生多(duo)(duo)個(ge)預(yu)測(ce)的(de)kcat值。目前在這些(xie)情況下，研究(jiu)人員(yuan)會選擇最大kcat值，但最好設(she)計一種(zhong)(zhong)方法來預(yu)測(ce)每種(zhong)(zhong)多(duo)(duo)底(di)物和(he)異(yi)聚酶(mei)(mei)的(de)一個(ge)kcat值。

圖(tu)示：用于預測和解釋突變(bian)酶kcat的深(shen)度學習模(mo)型。（來源：論文）

此外，DLKcat衍生的(de)DL-ecGEM和(he)(he)后驗(yan)均(jun)值ecGEM繼承了(le)基本GEM的(de)局(ju)限性，其中基于(yu)約束(shu)的(de)建(jian)模的(de)核心(xin)穩態假(jia)設允許人(ren)們確定代(dai)謝(xie)通(tong)量，但(dan)不(bu)容易考慮調節(jie)行為(wei)。雖然ecGEM極大地將基于(yu)約束(shu)的(de)模型的(de)解空間減少到細胞可(ke)行容量，但(dan)kcat并不(bu)是決定反應速率的(de)唯一動力(li)學參數(shu)，例如，親和(he)(he)常數(shu)起著重要的(de)作用。然而，由于(yu)基于(yu)約束(shu)的(de)模型無(wu)法預測內部(bu)代(dai)謝(xie)物濃度，因此目前無(wu)法輕易考慮這些(xie)參數(shu)的(de)影(ying)響(xiang)。

盡管如(ru)(ru)此，kcat值也(ye)(ye)是其他資源分(fen)配(pei)(pei)(pei)模(mo)型(xing)(xing)中(zhong)的(de)(de)重要參數，例如(ru)(ru)蛋白(bai)(bai)質(zhi)組約(yue)束的(de)(de)GEM和代謝/大分(fen)子表(biao)達模(mo)型(xing)(xing)。盡管改(gai)進的(de)(de)預測和更多的(de)(de)應(ying)用，如(ru)(ru)何(he)定義kcat值也(ye)(ye)仍然是重建這些模(mo)型(xing)(xing)的(de)(de)挑戰。這種資源分(fen)配(pei)(pei)(pei)模(mo)型(xing)(xing)和ecGEM都(dou)認為細胞需要將(jiang)其有限的(de)(de)蛋白(bai)(bai)質(zhi)組分(fen)配(pei)(pei)(pei)到不同的(de)(de)途(tu)徑以實現更快的(de)(de)生長或更好(hao)的(de)(de)適應(ying)度，而每(mei)個反應(ying)的(de)(de)蛋白(bai)(bai)質(zhi)組成本同樣由酶的(de)(de)通量和動力學速率定義。

因此，這些(xie)模型(xing)的(de)代謝(xie)部分的(de)深度學(xue)(xue)習預(yu)測(ce)kcat值可(ke)以提高其質量和性能，盡管(guan)無法從DLKcat獲(huo)得在這些(xie)模型(xing)公式(shi)(shi)中確定的(de)其他具有挑戰性的(de)動力學(xue)(xue)參數，例如(ru)核(he)糖體催化率。此外(wai)，特別關注描述酶動力學(xue)(xue)的(de)模型(xing)公式(shi)(shi)可(ke)以受益于深度學(xue)(xue)習預(yu)測(ce)的(de)kcat值，因此DLKcat方法可(ke)以在建(jian)模領域找到廣泛的(de)應用(yong)。

總之，DLKcat產生了現實的(de)kcat值，可(ke)用于指導(dao)未來的(de)基(ji)因(yin)(yin)工程、了解酶進化(hua)和(he)(he)重建(jian)(jian)ecGEM以(yi)預(yu)測代謝(xie)通量和(he)(he)表型。除此之外，這種基(ji)于深度學(xue)習的(de)kcat預(yu)測工具的(de)許多(duo)其他潛(qian)在用途，例如基(ji)因(yin)(yin)組(zu)(zu)挖掘和(he)(he)全基(ji)因(yin)(yin)組(zu)(zu)關(guan)聯研究分析(xi)(xi)中(zhong)的(de)工具。開(kai)發(fa)的(de)自動貝葉斯ecGEM重建(jian)(jian)管道(dao)將有助于進一步用于ecGEM重建(jian)(jian)，用于組(zu)(zu)學(xue)數據合并和(he)(he)分析(xi)(xi)。

論文鏈接：//www.nature.com/articles/s41929-022-00798-z

中文字幕日本人妻久久久免费_中文字幕久久久人妻无码_中文字幕在线观看_非洲黑人吊巨大vs亚洲女

芬蘭Kibron專注表面張力儀測量技術，快速精準測量動靜態表面張力

新聞中心Info

> 公司新聞

> 行業資訊

> 產品百科

合作客戶/

相關新聞Info

> 基于表面張力的超薄薄膜力學性能表征方法研究

> 旋轉滴法表面張力儀的概述

> 墨水是怎么產生的？墨水的“前世今生”

> 不同膜壓下鈣誘導的磷脂排序研究——摘要、介紹

> 當水的溫度升高時表面張力會變小

> 海洋細菌中生物表面活性物質——材料和方法

> 在水中有沒有可能呈現出多邊形的油滴呢？

> 表面活性劑在土壤污染治理中的應用

> 液體表面張力的試驗目的和原理

> 表面張力儀的校準、檢測方法以及操作步驟

推薦新聞Info

> 全自動表面張力儀測定原理和使用方法【表面活性劑烷醇酰胺】

> 硝磺草酮懸浮劑制劑不同稀釋倍數的動態表面張力測定結果

> 原油中活性物質與堿作用下對界面張力的影響

> 揭示界面張力在鈣鈦礦晶體生長過程中作用機理

> 超細纖維：固體表面能的測量過程與操作步驟

> 便于調節的表面張力儀結構組成及原理

> 一文了解什么是?馬蘭格尼效應及其原理、現象和工程應用

> 基于脈沖焊接研究表面張力活性元素對Marangoni力的影響

> 變壓器油界面張力檢測方法之準確性對比

> 超聲協同殼聚糖處理對蛋黃液界面張力的影響

使用深度學習方法高通量預測代謝酶的 kcat，或揭開細胞工廠秘密