本文来自微信公众号:脑极体(ID:unity007),作者:风辞远,头图:Pixabay。
1928 年,英国细菌学家弗莱明发现一种新霉菌,具有极强的杀菌作用,因为是青霉分泌的,被命名为青霉素,这一药物被丘吉尔称为 “二战时最伟大的发明”,将人类平均寿命延长了20多年。
今天有科学家认为,如果有新的有效的抗菌药来应对细菌对免疫系统的攻击,那么一些常见疾病,甚至肿瘤都有控制和治愈的希望,人类寿命有望延长,理论上能达到120岁。
遗憾的是,新药研发投入大、周期长、失败率高,青霉素已经出现了近百年,而抗菌药研发的速度远远跟不上细菌进化/耐药的速度,微生物领域已经有近四十年没有出现新药。2008年《自然》杂志发表的《穿越“死亡之谷”》一文中曾提到,人们希望制药行业跨越从实验室到患者的鸿沟,然而无论是基础研究人员还是医生,都不愿意去那里冒险。
幸运的是,总有一些科学家敢于向未知发起挑战,为人们带来新药的曙光。最近西安交通大学第一附属医院(以下简称”西安交大一附院”)刘冰教授,就突破性地研发出一款超级抗菌药Drug X,有望成为全球近40年来首个新靶点、新类别的抗生素。
作为一款创新药,Drug X代表着一种新药研发的全新可能。
首先,创新性。Drug X是一个全新类别、全新靶点的抗生素,是具有极高创新性的“超级抗生素”,其靶点特质决定了细菌将难以对Drug X产生耐药性,代表了中国原创性药物的一次突破。实验数据表明,只需常用抗菌药10%的浓度,该超级抗生素就能达到10倍的治愈效果,并且对抗疟(即疟原虫)药物研发等多个领域带来重要影响。
其次,低成本。基于华为云盘古药物分子大模型打造的华为云AI辅助药物设计服务,Drug X的先导化合物研发周期从数年缩短至一个月,研发成本降低70%,打破了医药界“双十定律”,即一款创新药从研发到上市,平均成本超过10亿美元、研发周期大于10年,新药研发的瓶颈有望打破。
另外,转化率。药物研发是一个系统工程,做出化合物只是第一步,后续大量的资金投入和风险都存在于临床等成果转化阶段,此前中国新药的临床应用转化率不到8%,Drug X的进展显然是比较顺利的,已进行动物实验验证,目前已推进到支持IND(新药临床研究审批)申报的临床前研究阶段,并在国际范围申请专利。其中,科研机构、医药产业链、华为云等产学研用紧密结合的模式是值得关注的。
Drug X的出现,似乎给中国原创性新药从研发到应用带来了更多可能性。我们就从这款代表了无限X的新药出发,聊聊科学家如何跨越新药研发的天堑。
AI这张药方,需要一味“药引”
毋庸置疑,AI已经成为新药研发打破“双十定律”的一张公认有效的药方。全球44家顶尖药企联合发布的《AI辅助药物研发行动白皮书》显示,2015年以后,药企使用AI技术服务行动次数显著增长。目前,AI已经在临床发现线索、靶标发现、确定候选药物、临床前实验(实验室和动物测试)、临床研究(人体测试)、生产工艺等各个环节进行赋能。
AI这张药方虽然被业界认可了,但新药研发难的顽疾,并没有那么容易根治。就拿Drug X所属的抗菌药来说,研发过程中就遭遇了不少难题。
第一,计算量大。目前已知的抗生素有四种不同的杀菌机制。如果细菌对其中一种机制获得耐药性,则同机制的其他药物对该细菌均不再起效用,因此需要全新靶点、全新类别的抗生素。但在化学空间里,人类可发现的药物分子个数多达10的60次方个,如何在海量的化学分子中快速地寻找到适合成药的分子结构,并用AI进行成药预测、药理毒理预测等算法模拟?这一工作会直接影响到临床成功率。刘冰教授团队想用药物来模拟噬菌体的活动,没有先例可以参考,只能大量尝试,刘冰教授形容其为“题海战术”,这就需要带来了较高的计算资源需求和成本。
第二,周期较长。AI参与新药研发是数据驱动的,从超大规模化合物库中进行计算,是一个穷举式深度搜索,这个过程十分考验算法的有效性、鲁棒性、准确率等,算法能力直接影响到研发效率和周期。生物和AI的学科研究体系各不相同,用好AI这个工具,对生物科学家有比较大的学习门槛和挑战。刘冰教授坦言,自己对AI有一定了解,但作为生物学领域的专家,面对算法软件等跨学科知识时难免捉襟见肘。
第三,数据壁垒。数据在医药行业是高壁垒、高成本、高机密的,很难共享,比如抗菌药研发要用到的小分子数据库等,是阿斯利康、GSK这样的传统药企在长期经营中积累起来的,以前中国科学家想要用这些数据做实验是比较难的。而缺少数据,意味着前期药物分子筛选环节就存在了大量的不确定性和盲区,如果找不到足够多有潜力的小分子,后续实验验证、临床等投入都可能打水漂。
因此,在刘冰教授看来,科研的整个过程中,失败远多过成功,可能1万次失败里才有1个成功。不解决上述问题,AI辅助新药研发的价值也很难兑现。不过,在刘冰教授团队的研发遇到一些瓶颈之后,华为云带着盘古大模型来了。
跨越鸿沟,云梯的三个台阶
免疫学家麦达瓦尔曾说过:凡不虚伪的科学家都会承认运气在科学发现中所起的作用。面对新药研发从实验室到患者应用的这道鸿沟,刘冰教授团队与华为云合作,通过华为云在医疗领域的三个“台阶”,架起了一座云梯,让新药研发的每一步不再全凭运气,更稳地跨越鸿沟。
以Drug X的研发为例,2020年,刘冰教授在一些细菌的抑菌机制有了新的发现,但当时实验室建设启动不久,缺算力、缺算法、缺数据、缺产业支持,正在困难时期,华为云的三个“台阶”架起了一座云梯。
第一个台阶:盘古大模型。
2021年4月,华为云发布了盘古系列超大预训练模型,旨在建立一套通用、易用的人工智能开发工作流,实现人工智能工业化开发,后来又进一步场景化细分,推出了盘古药物分子大模型,刘冰教授在新药研发的工作中正是采用了盘古药物分子大模型打造的AI辅助药物设计服务,解决了三个关键难题。
一是筛选难题。前面提到,药物筛选要从上亿个小分子中找到具有潜力、排名靠前的种子选手,而中国科研团队不像海外传统药企那样有多年重金积累的实体小分子库、数据库,对刘冰教授来说,自己建立一个小分子库需要不可想象的资金,而盘古大模型就提供了一个用AI寻找潜力小分子的“捷径”,AI能够分析推荐排名较高、潜力较大的分子,减少前期尝试成本。华为云盘古药物分子大模型预先学习了17亿个药物分子的化学结构,生成了包含超过1亿种可用于虚拟筛选的新分子结构的药物数据库DrugSpaceX,为开展虚拟筛选和药物分子设计提供了高质量的资源。在这个全新的亿级小分子库中,华为云通过AI对药物分子的80多种理化性质(包括水溶性、代谢活性、排泄速率、毒性等)进行属性预测和打分,筛选出成药性好,且结构新颖性为100%的药物分子。在AI优先推荐的药物分子基础上,研究团队再进一步进行人工实验验证。AI技术为研究人员节省了大量时间和资金。
二是药效预测难题。生物计算的难点在于,每个小分子背后都有隐藏的生物学意义,比如有效性、毒性、成药性等等,有时候AI算法基于数据驱动设计出的化合物可能并不符合药代动力学的要求,无疑又会增加科研的失败率和成本。这一点上,华为云盘古药物分子大模型做到了比较好的水平,通过盘古药物分子大模型的分子属性预测器,刘冰教授团队对生成的化合物实时评估成药性指标,进一步优化和迭代先导小分子化合物,大大加速了新药研发的进度,实验结果表明,盘古药物分子大模型的成药性预测准确率比传统方式高20%,经过毒性、药代动力学验证的药物已经进入到支持IND(新药临床研究审批)申报的临床前研究阶段了。
三是跨学科难题。说了这么多,你可能会觉得刘冰教授团队用AI驱动新药研发进度飞速,一定有什么算法科学家或者高级工程师吧,还真不是。刘冰教授坦言,自己就几个人的团队能够在AIDD(AI驱动新药研发)迈出关键一步,在正常的科研领域里面几乎是“天方夜谭”,其中离不开盘古大模型的一系列配套AI工具链,UI做得非常人性化,任何一个从业人员不需要计算机基础都可以使用,团队在使用上没有遇到什么障碍,也大大加速了先导化合物的研发周期,从数年缩短至一个月。
第二个台阶:华为云算力。
生物计算需要的算力资源极其庞大,此前DeepMind曾披露过,即便使用128个TPU去训练AlphaFold,也需要11天以上才能完成,无论硬件成本还是时间成本,都是生物科研团队的“不可承受之重”。要充分发挥盘古生物医药大模型的作用,离不开华为云端的强大算力支持。作为盘古大模型的算力基座,华为云拥有万核超大算力,可帮助大幅提升药物筛选效率,将刘冰教授团队的研发成本降低70%。
第三个台阶:EIHealth智能体。
新药研发是科学家的工作,临床验证、上市审批、生产制造到成功问世却需要整个产业链的参与联动,加速新药成果转化,华为云医疗智能体EIHealth 的AI药物研发合作项目起到了非常重要的帮助。一方面,EIHealth形成了一个产学研用的合作平台,为科研人员、高校、企业从业者提供了很多渠道、资源上的交流机会,分享成功经验,加速AI制药的研发、转化和应用。另一方面,EIHealth实现了平台化集成,提供大量相关AI模型算法与资源。比如基因组引擎、药物研发引擎、临床研究引擎等,帮助科研团队在探索相关领域时避免重复建设,降低综合成本与失败率。正如刘冰教授所说,当我们在科学上有突破的时候,使用一个技术快速将它转化,这才是我觉得能够促进社会发展的良性流程。在与华为云EIHealth医疗智能体负责人乔楠博士的交流中,刘冰教授听说印度尼西亚急需能够替代奎宁的药物来解决疟疾,这让他看到了新型超级抗菌药在现实中能够解决的重要问题。
从这个角度来说,华为云的三个台阶,可以被看作是新药研发跨越鸿沟的一道捷径。百年前,青霉素的发现来自一次偶然,而今天,在深渊跋涉的科学家们,有了云的帮助,得以更快地跨越未知。
其中,无论是盘古大模型、云端算力还是产业化加速,华为云所提供的价值是很少有其他厂商可以提供的。这也是我们开始好奇,随着盘古药物分子大模型为更多生物科学家所用,AI是否能真的变成“药神”呢?
从Drug X到无限可能:盘古的下一站
严谨地说,今天盘古药物分子大模型助力新药研发,还处于起步阶段,就像刘冰教授所说:Drug X的出现是AIDD的一次很好的验证。但可以肯定的是,验证成功之后的AIDD将进入指数级的高速发展期。
世界和人类已经渴盼新药太久了,随着现代生物学技术的发展、人类基因组计划的完成,我们已经发现了大量可供治疗干预的新型靶点,而成药的只是其中的冰山一角。正如Drug X的研发进程一样,AI在筛选潜在靶点、加速筛选和优化验证效率等环节的重要价值,必将在未来进一步释放,或许很快我们就能看到更多全新靶点、更有效的大小分子药物跨越鸿沟,为更多患者带来希望。
在这个过程中,华为云的盘古药物分子大模型,无疑需要发挥好以下作用:
1.技术支点。目前,华为云盘古药物分子大模型已经在分子库、超大规模化合物表征模型训练、预测准确度等方面取得了领先优势,不过,华为云人工智能领域首席科学家田奇博士也曾公开表示过,未来还要进一步练好大模型,在根技术、架构优化、学习训练、回调部署等方面继续发力,进一步释放AI在各个产业中的潜力。
2.场景贯穿。大模型的本质是经世致用,要用好大模型,首先要找到哪些场景适合使用大模型,华为云盘古药物分子大模型已经完成了这一步,Drug X的出现证明了AI在“药物分子筛选”和“药物分子优化”两大关键环节的意义,盘古大模型也已经开始支撑多家药企和科研院商业服务或药物管线开发合作,合力推测,未来AI将在整个新药研发场景上全面贯穿,真正实现从研到用的全流程融合。
3.产业枢纽。找到了可用、好用的应用场景,接下来就需要推动大模型在生物制药领域的规模化复制,进入工业化AIDD的加速阶段。无论是盘古大模型的工程化能力、配套工具链,还是EIHealth的生态化合作赋能,加速协同创新,整体推动AIDD来到产业化规模的新阶段。
技术化、应用化、产业化,从中可以窥见华为云盘古大模型在产业智能化上的不同思考:始终将落地行业创造更大价值作为新技术的基础。有了这一初衷,才有了大模型助力Drug X的快速诞生;有了Drug X超级抗菌药的出现,AI驱动新药研发就得到了一次清晰可行的验证;有了这一成功,会有更多X可能性药物从AIDD中喷涌而出。从这个角度看,在AI逐渐普及进入各行各业的今天,华为云盘古大模型是产业智能化“多米诺骨牌”的起点,也是代表着无限可能的X。
法国哲学家布莱兹·帕斯卡说过:“人只不过是一根苇草,是自然界最脆弱的东西;但他是一根能思想的苇草。用不着整个宇宙都拿起武器来才能毁灭;一口气、一滴水就足以致他死命了。”当科学家们——这个人类中最具智慧和勇气的群体——在AI+云时代中奋力前行,我们可以共同期待那一天,人类可以在面对疾病时,不再如此脆弱。
本内容为作者独立观点,不代表创新湾立场。如有异议,请联系创新湾。创新湾聚焦新科技、新产业,相关内容欢迎投稿。(投稿或转载请联系创新湾小编微信:EnnoBay2020)
领先一步看见未来
创新湾ID:EnnoBay