News

新闻动态

首页 新闻动态 公司动态

盛世君联参与张康团队新型人工智能PPI预测模型开发,提升大分子药物研发能力

蛋白质-蛋白质相互作用(protein-protein interaction, PPI)是两种或以上的蛋白质结合的过程,参与调控生命过程的众多环节。如何建立高效准确的PPI预测模型,一直是AI研究的热点和难点。成都盛世君联生物技术有限公司的AI科学顾问张康教授近日在《NATURE MEDICINE》发表《Deep-learning-enabled protein–protein interaction analysis for prediction of SARS-CoV-2 infectivity and variant evolution》。该文描述了一种创新的人工智能PPI预测模型——“UniBind”。UniBind整合分析各种不同实验来源和模态的数据,基于生物进化规则,对可能新出现的新冠病毒突变株进行了预测。更重要的是,UniBind预测的多个ACE2突变体,湿实验证实与RBD的结合力高于野生型1000倍。盛世君联(ABLINK BIOTECH)参与了文章中的蛋白分子设计和湿实验验证工作。


文章概述

近年来深度突变扫描技术的快速发展产生了大规模数据集,这些数据集有可能揭示蛋白质的内在特征。结合其他大规模蛋白组学和生化数据库,如SKEMPI 2.0,大量数据为AI建模和PPI预测提供了可能性。


UniBind是一种多任务学习方法,通过整合蛋白质结构、亲和力数据和异质生物信息,可以有效地预测SARS-CoV-2变异对人源及其他种属ACE2受体及抗体的结合亲和力影响。经过在多个基准数据集上的系统测试和实验验证,UniBind可以准确、可扩展地预测SARS-CoV-2变异对人源ACE2受体的结合亲和力影响,对中和抗体的影响,及预测病毒未来的变异趋势。


UniBind的特色是多任务学习和模型集成训练模式,以解决数据异构性问题。以对SARS-CoV-2 RBD 1-4个点突变的预测为例,多点预测能对PPI产生更多的约束,从而更有效地预测未来的病毒进化及免疫逃逸。同样,对已知变异的抗体亲和力和免疫逃逸综合评分,结果也与临床观察一致。


该模型可以扩展到预测ACE2突变对病毒亲和力的影响。基于计算模拟的进化方法,UniBind生成了13,913个高于野生型亲和力的ACE2变体。选择了模型预测评分较高的五个ACE2变体进行湿实验验证,结果显示它们与S蛋白的结合亲和力提高了100-1000倍(下图),这些结果突显了UniBind在PPI预测中的准确性。

640



总之,UniBind为预测蛋白质相互作用提供了一个通用框架,非常适合应用于生物医药领域的大分子药物开发。


专业评论

曾昕(首席技术官):

PPI可谓“后AlphaFold2时代”蛋白质AI预测最受关注的下一个杀手级突破,但目前已有的研究普遍受困于数据量和算法方法论的不足,不能得到广受认可的PPI通解模型。本文选择新冠这一数据急速增长的细分领域作为切入点,凭借研究者对生物学和信息学的优秀理解整合使用了多种来源的生物学数据,可以说是用好有限数据以提高数据质量进而提高AI模型能力的典型案例。另外,湿实验目前仍是检验干实验的金标准,对于追热点且热点数月一变的AI+应用领域,干湿结合良性循环的工程能力也是不可或缺的。


黄琛(首席信息官):

AI For Biotechical在过去几年取得重大的突破,随着AI不断应用到PPI的研究中,一方面在AI模型上会快速迭代,一方面生物技术的进步,比如万亿级多样性噬菌体库的建成结合NGS测序,生物数据增长的速度也会呈现指数级增加,预计未来2-3年AI For Bio必定会对药物设计产生根本性的颠覆。在目前阶段,AI模型与生物实验方法相辅相成,AI模型提供预测大大降低时间成本和提高效率,生物实验方法验证结论并明确数据标签。本文建立了UniBind的模型,使用实验方法进行了模型结论的验证,对新冠病毒的感染和进化做出科学的预测,最大的亮点是对于海量生物异构数据的处理,文中认识到虽然建模技术很重要,但是真正决定模型质量的是数据,文中模型基于与特定问题相关的数据而建立,实现了实验数据与AI模型的闭环验证。此外如果具备了高质量的海量抗体标签数据,继而建立超参数适应模型多任务和异构集成,UniBind也可以向抗体药物设计的通用模型发展。


人物介绍

张康

盛世君联公司AI科学顾问,美国加州大学圣地亚哥分校眼科学和人类遗传学终身正教授,哈佛大学和麻省理工学院首位来自中国的医学和遗传学双学位博士获得者。入选国家“千人计划”。现任澳门科技大学医学院教授和科大医院眼科临床医生、澳门科技大学医学院副院长。他带领的研究团队基于大规模的临床数据分析和深度机器学习,在CELL、Nature、Nature Medcine等顶尖杂志发表多篇AI技术应用的突破性文章。


曾昕

盛世君联公司首席技术官。清华大学结构生物学博士,先后入选成都市“蓉漂人才”计划、高新区“金熊猫人才”计划。曾以共同第一作者在Nature发表蛋白质结构研究工作,在基于结构出发的生物药物开发、AI Workflow设计等域有着丰富的一线经验。


黄琛

盛世君联公司首席信息官。四川大学生物力学硕士,微软、甲骨文10年+工作经验,“蓉漂顶尖团队”核心成员。在数据管理、集成、融合上拥有丰富经验。


如果您有兴趣了解原文,请联系我们~


在线留言
提交