桃子汉化组移植游戏大全

机器学习实现酶进化中多位点重组和迭代:韩双艳教授课题组取得重要进展
发布人:谭晓慧    发布时间:2025-01-09    浏览次数:11

 近期,华南理工大学生物科学与工程桃子汉化组移植游戏大全韩双艳教授课题组在《Protein Science》和《International Journal of Biological Macromolecules》期刊上分别发表了题为“A protein fitness predictive framework based on feature combination and intelligent searching”和“Machine learning-guided multi-site combinatorial mutagenesis enhances the thermostability of pectin lyase”的研究论文。研究提出了一种具有自主知识产权的新型蛋白质适应度预测模型——scut_ProFP,并利用 该模型成功设计和实现了果胶裂解酶的17位点的重组迭代,最优突变体较野生型在高温下热稳定性提升67倍。硕士研究生张智慧为论文第一作者,韩双艳教授为通讯作者。华南理工大学生物科学与工程桃子汉化组移植游戏大全为第一单位。

 图1 scut_ProFP 蛋白质适应度预测模型工作示意图


 蛋白质氨基酸序列与其功能之间的映射关系可用蛋白质适应度地形表示,寻找解析适应度地形上最高点所对应的氨基酸序列则可能获得进化最优的蛋白,这也是蛋白质改造的目标。然而,多位点变异组合后导致可能的序列数量非常庞大,传统的方法(如定向进化)难以全面探索,容易陷入局部最优。近年来,数据驱动的机器学习为探索适应度地形提供了新的可能。但如何从有限的蛋白质序列中提取关键特征,以优化模型性能,仍是一个亟待解决的问题。

 在本研究中,我们提出了一种具有自主知识产权的命名为scut_ProFP的蛋白质适应度预测模型(图1)。该模型通过特征组合提供全面的序列信息,并结合特征选择优化模型性能,实现“序列-功能”精准映射。scut_ProFP展现出卓越的预测性能,与深度学习模型(如ECNet、EVmutation和UniRep)相比也具有竞争力和独特优势。此外,scut_ProFP能够捕捉到突变之间的上位性效应,可以从低阶突变体泛化到高阶突变体(图2)。

 图2 scut_ProFP外推能力测试  

 (a) (b) 在GB1和YAP1数据集上,用单突变体数据训练模型预测双突变体适应度的斯尔曼值;(c) 在CreiLOV数据集上,用1-3阶突变体数据训练模型预测4-14阶突变体适应度的斯尔曼值;(d) GB1数据集上不同上位性效应的预测。


 我们利用scut_ProFP指导了果胶裂解酶PMGL-Ba的17位点组合突变,对近20万种组合突变体的热稳定性进行了排序预测。利用152个样本(约占整个酶序列空间的0.08%),即可筛选出多个高耐热突变体(图3)。经过一轮迭代学习,表现最优的组合突变体P36在75℃和80℃下的半衰期分别提高了67倍和39倍,酶活提高了2.1倍。

 图3 机器学习预测组合突变体的实验验证及迭代学习

 (a) (c) 第一轮机器学习预测突变体的实验验证及序列Logo;(b) (d) 第二轮机器学习预测突变体的实验验证及序列Logo。


 scut_ProFP能够采用小样本数据有效提升突变体预测效率,减少湿实验投入,为机器学习指导蛋白质进化与改造提供了一种新途径。上述研究得到了国家重点研发计划2021YFC2100400和2022YFC2105500的资助。同时特别感谢华南理工大学软件桃子汉化组移植游戏大全谭明奎教授团队在模型开发中提供的帮助与支持。


论文链接:https://doi.org/10.1002/pro.5211;https://doi.org/10.1016/j.ijbiomac.2024.134530。


温馨提示×
生物科学与工程桃子汉化组移植游戏大全院务公开信息敬请登录大阳城娱乐43335统一门户“本单位动态”栏查看。谢谢!
统一门户 >>
桃子汉化组移植游戏大全最新网页版在线平台(2025已更新)