近日,信息學(xué)院張亮團(tuán)隊(duì)與農(nóng)學(xué)院王宏偉教授在International Journal of Biological Macromolecules上發(fā)表了題為“MF-ProtDisMap: protein real-valued distance prediction with fusion of sequence and coevolutionary features”的研究論文。山東農(nóng)業(yè)大學(xué)張亮教授和王宏偉教授為該論文的共同通訊作者,山東農(nóng)業(yè)大學(xué)碩士張宇菲與廈門大學(xué)碩士鐘蘇陽(yáng)為該論文共同第一作者,山東農(nóng)業(yè)大學(xué)為第一通訊單位。
蛋白質(zhì)結(jié)構(gòu)的精確解析是理解生物微觀分子機(jī)制、基因精準(zhǔn)設(shè)計(jì)的基礎(chǔ)。盡管AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面取得了顯著成果,但如何進(jìn)一步優(yōu)化關(guān)鍵功能區(qū)域(如酶的活性位點(diǎn)、蛋白-配體結(jié)合界面)及獨(dú)立結(jié)構(gòu)域的預(yù)測(cè)精度,仍是當(dāng)前學(xué)界關(guān)注的核心問(wèn)題與研究焦點(diǎn)。殘基間實(shí)值距離預(yù)測(cè)不僅為解決上述問(wèn)題提供了高分辨率的幾何約束,還能直觀反映其內(nèi)部相互作用與空間組織,從而使模型預(yù)測(cè)結(jié)果具有更強(qiáng)的可解釋性。
團(tuán)隊(duì)基于ESM與MSA Transformer兩個(gè)大模型構(gòu)建了MF-ProtDisMap 大模型框架,該框架通過(guò)三項(xiàng)核心設(shè)計(jì)實(shí)現(xiàn)了性能提升:其一,雙通道特征提取模塊同時(shí)捕捉蛋白質(zhì)序列特征與共進(jìn)化語(yǔ)義信息;

圖1 MF-ProtDisMap 網(wǎng)絡(luò)架構(gòu)
其二,“group pooling”策略實(shí)現(xiàn)高效的特征降維與融合;其三,Diff-former 特征學(xué)習(xí)模塊結(jié)合三角注意力機(jī)制與擴(kuò)散模型以強(qiáng)化殘基間關(guān)系建模。在蛋白質(zhì)實(shí)值距離預(yù)測(cè)任務(wù)中,MF-ProtDisMap的MAE和RMSE分別為2.20?和3.40?,優(yōu)于ESMFold的2.56?和5.38?。此外,在接觸預(yù)測(cè)任務(wù)的驗(yàn)證中,該模型的 ROC 值為 84.56%,PR 值為 81.01%,均超過(guò)了現(xiàn)有最佳方法。鑒于缺乏能夠直接從實(shí)值距離預(yù)測(cè)重建蛋白質(zhì)結(jié)構(gòu)的可用工具,團(tuán)隊(duì)開發(fā)了ProtDisFold,用于距離約束結(jié)構(gòu)建模,并成功重建了祖先植物α/β-水解酶(PDB ID:7ukb)、Fhb7-GST和植物NLR Sr35的三級(jí)結(jié)構(gòu)。本研究將助力作物改良精準(zhǔn)設(shè)計(jì)、基于冷凍電鏡刻畫微觀結(jié)構(gòu)等領(lǐng)域發(fā)展。

圖2 α/β-水解酶、Fhb7-GST和NLR Sr35的3D結(jié)構(gòu)模型
該研究得到了國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目、國(guó)家自然科學(xué)基金、山東省自然科學(xué)基金的資助。
論文鏈接:https://doi.org/10.1016/j.ijbiomac.2025.147637
編 輯:萬(wàn) 千
審 核:賈 波








