从预测走向现实如何赋能生命健康领域?
不同于深耕大语言模型的OpenAI,谷歌DeepMind在结构生物学领域越走越深,从尝试预测蛋白质的三维结构出发,如今已实现对大部分生命分子的预测。
2018年,DeepMind推出第一代AlphaFold模型,开始公开其在蛋白质预测领域的工作,首代即达行业“天花板”高度,推进了蛋白质结构预测的前沿;2020年,DeepMind发布AlphaFold2,被认为是蛋白质结构预测领域的里程碑式突破。今年5月,DeepMind再次对该模型实现更新,推出AlphaFold3,直接登上Nature头条,引起业内广泛关注。
IQVIA高级分析和人工智能解决方案负责人金晖向21世纪经济报道记者介绍,AlphaFold主要是AIforScience领域的应用,相比于Alphafold2,Alphafold3不仅提高了预测准确度,还进一步扩大了预测范围。Alphafold2是预测蛋白质单体结构,而更新之后还可以预测蛋白复合物间相互作用、蛋白与小分子相互作用等。
据官方披露的信息,AlphaFold3引入了Pairformer,使模型更关注结构部分,使用Diffusion代替原来的结构模块。升级之后的AlphaFold3可以直接预测原子3D坐标,成功将AI的能力扩展到DNA、RNA等领域。对于蛋白质与其他分子类型的相互作用,AlphaFold3在基准测试中的准确率比现有最好的传统方法高出50%,也因此成为首个在生物分子结构预测方面超越基于物理工具方法的AI系统。
沙利文大中华区执行总监周明子对21世纪经济报道表示,以AlphaFold3为代表的同类AI工具,为医疗行业发展带来了深远的影响。它们通过精准预测生物分子结构,加速了药物研发进程,推动了精准医疗的发展,并促进了科研合作与交流。
“这些技术工具不仅提高了药物研发的效率和成功率,还为疾病机制的深入理解提供了新视角。未来,随着技术的不断成熟和应用领域的拓展,AI工具在医疗领域的应用前景将更加广阔,有望为医疗行业带来更多创新和变革。但也需要关注技术成熟度、数据安全与隐私保护以及法规政策等方面的挑战。”周明子说。
赋能药物研发
人类对蛋白质结构的预测已持续半个世纪之久,从预测走向现实如何赋能生命健康领域?AI入局之前,科学家主要用计算机分析蛋白质,但预测准确率较低,结构细节往往不被采信,多被当作晶体结构解析的模板使用,想要真正确认蛋白质的结构还是要通过实验。
AlphaFold的出现开始加速改变这一现状,初代AlphaFold已展示出了强大的预测实力,在CASP13(第十三届国际蛋白质结构预测竞赛)中获得第一名。在CASP14中,AlphaFold2对大部分蛋白质结构的预测与真实结构只差一个原子的宽度。彼时,DeepMind表示,他们已经解决了关键的“蛋白质折叠问题”,并且将解决问题的运算时间从数月缩短至了数小时。截至目前,全球已有数百万的研究人员使用AlphaFold2在疟疾疫苗、癌症治疗和酶设计等领域取得了进展。
对于最近更新的AlphaFold3,只要给定分子输入列表,通过预测不仅能生成它们的联合三维结构,还能揭示分子之间的相互作用,这意味着AlphaFold3将人类带到了蛋白质之外的更广泛的生物分子领域。
毫无疑问,创新AI工具的应用能够加速药物研发。金晖表示,药物研发领域有一个“双十定律”,即研发一款新药需要10年时间、10亿美金的投入。以AlphaFold3为代表的AIforScience的工具,可以为药物研发指明方向,加速研发过程,提高研发效率。
有券商分析师对21世纪经济报道指出,通过预测药物分子与疾病相关蛋白的相互作用,AlphaFold3显著加速了药物筛选过程,极大地提升整个新药研发阶段最耗时的筛选效率;通过底层逻辑来洞察新药的机制,能够提高疾病治疗的精确性,AlphaFold3可以帮助科学家更深入地了解疾病通路和蛋白质功能,从而设计出更精准的治疗方案,包括个性化医疗和靶向治疗。
不仅如此,AlphaFold3整体上可以降低研发成本。传统的蛋白质结构解析成本高昂,耗时且需要复杂的实验设备,AlphaFold3通过AI技术降低了这些成本,使得更多的科研机构能够参与到相关研究中。
转向开源
关于大模型的开源和闭源,行业内的争论从未停止,此次AlphaFold3也卷入了其中。
2021年,DeepMind宣布对AlphaFold2进行开源,并发布了其模型和代码。而此次AlphaFold3发布时,DeepMind并未打算发布其开源代码,科学家对其服务器的访问也受到各种限制:科学家可以通过AlphaFoldServer访问AlphaFold3,不过每天只能使用10次,且不能用于商业研究。科学家也不可能获得可能与药物结合的蛋白质结构。
此举遭到科学界的反对,认为这种做法不符合科学进步的原则,多位科学家联名撰写了一封致Nature的公开信,并得到数百位科学家的支持。随后,DeepMind宣布将在六个月内,开放AlphaFold3的代码和模型权重。与此AlphaFold3服务的每日使用次数上调为20次。
尽管如此,此后的一段时间仍有科学家在支持AlphaFold3走向开源。根据最新数据,已有超千位来自世界各国的科学家在公开信上署名。
面对AlphaFold3的冲击,我国又该如何不陷入“卡脖子”的困境?金晖表示,国内企业要持乐观态度,技术的发展从来都不是靠一家企业就可以实现的。当前AlphaFold3更多还是在实验室或学术界被广泛讨论,没有真正实现大规模商业化,国内企业还是有时间去追赶或提高的。
通过梳理不难发现,我国部分企业在相关方面已经有所突破。比如,华为的MEGA-Protein、深势科技的Uni-Fold、华深智药的OmegaFold、百图生科和清华大学共同开发的xTrimoPGLM,以及复旦大学和上海人工智能实验室合作推出的OPUS系列算法等多种工具,已经开始赋能生物蛋白质领域的基础研究与应用工作。
未来,我国AI企业及相关药企应积极布局以应对挑战并抓住机遇。
周明子建议,一方面,AI企业可以加大在深度学习、Transformer和Diffusion模型等前沿技术的研发投入,提升模型预测准确性和泛化能力,同时探索与生物医药领域的深度融合,开发出更多具有实际应用价值的AI工具。
另一方面,药企应加强与AI企业的合作,利用AI技术加速新药研发流程,提高研发效率和成功率,同时关注AI在药物优化、疾病诊断等方面的应用,以科技创新推动产业升级。
“双方还应共同关注数据安全和隐私保护,确保在推动技术进步的也符合法律法规和伦理要求。”周明子强调。
商业化落地存壁垒
DeepMind首席执行官Hassabis认为,AlphaFold3通过加速生物学科研,将打开超过1000亿美元的药物研发市场。同时预计未来几年,会有一大批人工智能设计的药物进入临床,为人类的生命健康带来巨大好处。
面对成百上千亿美元的市场,如何实现商业化成为企业需要思考的问题。事实上,为更好实现AlphaFold项目的商业化,2021年11月,谷歌成立了IsomorphicLabs,布局药物研发。今年1月,IsomorphicLabs宣布与全球制药巨头礼来和诺华建立战略合作。当前,IsomorphicLabs已经使用AlphaFold3为其内部项目以及合作伙伴进行药物设计。
“在AI制药领域,科技巨头和传统的头部制药企业的合作更能够为行业带来更多的颠覆。”上述券商分析师表示,不过,要想真正实现大规模商业化还有诸多壁垒。
在金晖看来,目前,AlphaFold3只是在生物分子层面做预测,要真正实现AIforScience还有很长的路要走。一方面,AlphaFold3这一模型的训练成本非常高,需要耗费大量的资源;另一方面,在真正做实际应用时,还需要硬件层面的一些准备。企业也还在寻找PMF(产品市场匹配),所以未来大规模的商业推广、商业模型以及实际落地后为终端用户带来的商业价值还需要不断摸索。
周明子认为,AI在结构生物学及整个医疗领域实现大规模商业化落地,需通过技术不断成熟与应用拓展。如AlphaFold3在蛋白质结构预测中的成功应用,推动了药物研发与疾病机制研究的进程。然而,要达成这一目标,还需克服多重壁垒,包括技术成熟度与可靠性的进一步提升、高质量医疗数据的积累与整合、数据隐私与安全保护机制的完善,以及适应行业特点的法规政策与标准的制定。跨界合作与产业融合也是推动AI在医疗领域商业化落地的重要路径。
据行业媒体预测,预计到2025年,30%的新药将会使用AI研发。截至目前,FDA已经批准了100多种使用AI或机器学习进行开发的药物候选物的临床试验,不过想要最终上市可能还需要数年时间。
“药物研发过程很漫长,AI参与的结构预测只是其中最初的步骤。这些研究成果还需进行临床研究验证才能进行应用。”上述券商分析师说,无论如何,人工智能和医疗行业相结合,是未来发展的一个大方向。星星之火的阶段是人工智能嵌入到医疗行业不同场景,从而解决具体的问题,未来,人工智能将在医疗领域实现更深层次的应用,从而带来整个行业的巨大改变。
(作者:见习记者闫硕编辑:季媛媛)