科技日报记者 刘艳
百度研究院在“2022科技趋势预测”中指出,基于AI的生物计算仍将高速发展,基础研究和应用场景协同创新将实现新突破。这一预测首先由百度自己添上了例证。
国际顶级学术期刊《自然》(Nature)子刊《自然机器智能》(Nature Machine Intelligence)日前在线发表的百度生物计算领域最新研究成果,提出了“基于空间结构的化合物表征学习方法”,即“几何构象增强AI算法”(Geometry Enhanced Molecular Representation Learning,GEM模型),揭示了一种基于三维空间结构信息的化合物建模方法,及在药物研发中的应用。
在该项研究中,百度螺旋桨PaddleHelix团队首次将化合物的几何结构信息引入自监督学习和分子表示模型,并在下游十多项的属性预测任务中取得 SOTA,成为百度对外公开的AI赋能药物研发的又一项重磅成果。
作为药物研发的关键一环,候选化合物的性质预测就像为临床试验“排雷”,即提前筛选掉毒副作用高、人体吸收代谢不好等具有不良特性的化合物。
这项任务以前只能通过传统仿真实验进行,成本高耗时长。也有研究人员引入深度学习技术,但大多基于序列或2D图结构建模,缺乏化合物三维空间结构信息的利用,导致化合物性质预测结果的偏差,亟须引入化合物的三维空间信息。
百度的重大突破是,在全球范围内开创性地将化合物性质预测从“2D建模”推进到“3D建模”。同时,引入预训练技术,利用大量无标注的化合物数据,通过自监督学习,构建GEM模型的底层能力,有望成为小分子药物研发领域的模型底座,解决小分子药物活性预测,成药性预测,药物设计等核心问题,加速药物,特别是全新药物的发现过程。
从实验效果看,百度GEM模型已在14个国际学术界公认的应用任务数据集上达到业界最佳。这些数据集包括:抑制HIV艾滋病病毒复制能力的数据集、小分子的生物活性数据集、血脑屏障渗透数据集等。
在应用价值层面,百度GEM模型可高效学习化合物的空间结构知识,并自主推断出空间结构信息,从而准确预测候选化合物的吸收、代谢、毒性等特性,帮助药物研发更快更准地完成早期筛选,目前已经在多个合作伙伴的研发管线中实现商业化落地,有望通过AI技术探索双靶点抑制剂新的研发范式,为癌症病人和自身免疫性疾病病人提供更有效的治疗药物。
此外,该方法还有助于高效测量药物-靶标相互作用,可加速新药研发,为老药发掘新用途,并探索多种药物联合使用,进一步增强疗效,降低抗药性和毒副作用,甚至疗治新病症。
百度这项生物学与计算机科学的跨学科创新,为化合物成药性预测、小分子药物筛选、药物联用等应用研究带来诸多裨益,未来更有望扩展到蛋白领域,构建基于蛋白的表征模型,服务于大分子的药物研发。
GEM模型已基于百度飞桨生物计算平台螺旋桨PaddleHelix在GitHub开源。
(图片提供:百度)
百度研究院在“2022科技趋势预测”中指出,基于AI的生物计算仍将高速发展,基础研究和应用场景协同创新...
2月23日,自然资源部公布5起挂牌督办土地违法案件调查处理意见。
2月23日,《浦东新区人工智能赋能经济数字化转型三年行动方案(2021-2023年)》(以下简称《行动方案》...
2月24日起三天,南方进入降水间歇期,我国降水主要出现在青藏高原一带。气温方面,今天起,我国大部掀起...
通报称,依据个人信息保护法、网络安全法、电信条例、《电信和互联网用户个人信息保护规定》等法律法规...