人大团队开发双驱动系统仿真模型

2023-06-22 13:39:11 来源: DeepTech深科技


【资料图】

中国人民大学高瓴人工智能学院长聘副教授主要从事 AI for Science、人工智能数理基础与前沿交叉前沿研究。

他提出面向复杂系统科学计算的新型机器学习方法,发展出一系列可用于复杂工程系统科学计算、气象/天气预报、科学探索等领域的人工智能系统,从而支撑辅助各个跨学科领域的信息化转型、实现落地,并大幅提高工作效率,表现出巨大的社会和经济效益。
凭借在 “AI for Science”的交叉研究、协同解决科学智能计算领域“知识嵌入”和“知识发现”关键科学问题,成为 DeepTech 2022 年“中国智能计算科技创新人物”入选者之一。

图丨DeepTech 2022 年“中国智能计算科技创新人物”入选者孙浩(来源:DeepTech)

为智能计算提供新范式
一般来说,如果将机器学习或深度学习用到复杂的物理系统,通过建模仿真解决相关问题时,需要丰富的数据进行标注。然而,在实际应用中,标注的数据却极其稀疏。
这种情况下,如果用传统的机器学习或深度学习的范式,对其进行学习建模是行不通的。另一方面,现有的学习范式可解释性相对较差。
为解决这些问题,与团队提出运用先验物理知识对人工智能模型约束或编码,发展数据和知识双驱动智能计算模型,增强了深度学习的外推和泛化性能[1]。他们成功解决了在小训练样本下复杂动态系统建模、非线性偏微分方程正反问题高效求解、数据驱动仿真等关键性难题。
图丨基于物理知识编码的循环卷积神经网络的架构示意图(来源:arXiv
这种新型理论计算框架和方法,如何能够在极少数样本的情况下进行学习建模,并具有一定的可解释性呢?简单来说,把现有的基本知识,以合理的方式嵌入到机器学习或学习模型中,让其形成知识嵌入或知识编码新模型。
一方面,与之前相比,先验知识的加入在可解释性上有所增强。另一方面,由于先验知识的补充,人们对数据的需求也会大幅度下降。新型的物理知识编码的深度学习模型可解决复杂物理系统中时空演化的动力问题,例如流体系统、时空演化的系统等。
人工智能的方法绝大多数基于纯数据驱动,也就是基于“连接主义”所形成的数据驱动的计算的模型及理论。
实际上,知识嵌入学习是把基于符号计算的“符号主义”方法和基于数据计算的“连接主义”方法融合,形成了知识嵌入学习。此外,该研究还讨论了一种方法,可从数据中提取目标控制方程或物理定律,进而实现新知识与新定律的发现。
面向科学探索中数据驱动的知识发现需求,他还进一步提出了一套新颖的符号方程学习和推理方法,从稀疏噪声测量数据中自动挖掘提取未知的定律或控制方程,实现对复杂动力/动态系统的可解释描述,已成功用于流体、生物化学反应扩散系统、细胞运动、混沌系统等问题。
图丨推理结果的误差传播曲线(左)和快照(右)(来源:arXiv
除了理论、算法、模型方面的工作,目前该团队在气象预报等方向做尝试性应用探索。气象系统由于具有非线性、混沌效应,是非常复杂的时空演化系统。
表示:“虽然其测量的数据量很大,但实际上它在描述系统本身。因此,针对系统本身的复杂度而言,测量是很稀疏的。我们在尝试利用这种新方法,去探索是否能够为气象预报提供更精准的预报格式。”
另一方面,该团队也在尝试在生物化学反应方面,是否能基于小规模测量样本解决建模仿真、反问题求解等任务。
此前,通过基于数值方法的科学计算来设计飞机、桥梁等工程系统,往往需要几天甚至几十天,经历迭代上万次才能得到最优解。该研究为科学计算提供了新的范式,从应用的角度可以加速设计的进程。将模型训练好后做推理,可在几秒钟甚至更短的时间内完成设计。
“我们的方法相当于为工程系统的反向设计提供了一个高效、快速的仿真器。如果未来该方法发展到一定的程度,可能会产生新工业革命。”说。

从力学到聚焦智能科学计算领域

实际上,并不是一开始就从事人工智能与交叉前沿的相关研究。在美国哥伦比亚大学攻读硕士及博士学位期间,他的主要研究方向是计算力学和动力系统建模与识别。
2014 年开始,随着深度学习研究的热潮,慢慢地开始接触这个领域。他发现,实际上很多传统的工程中和力学领域中遇到的问题,都可以通过数据驱动的范式解决。
但与此同时也必须看到,这种范式仍面临可解释性差、数据量多等问题。于是,他逐步思考将知识和定律融合的研究方向。新模型相当于起到了“1+1>2”的效果,其性能分别高于基于纯知识或纯物理的模型,以及基于纯数据的模型。
图丨Physics for AI(来源:孙浩)
近年来,得益于先进传感技术的发展和物联网系统的普及,城市基础设施安全与健康监测系统逐步形成。但是,如何对监测数据进行有效而高效地同化分析,仍然是一项重大挑战。
因此,面向国家在数据驱动基础设施安全与智能化管理的重大需求,发展高效而稳健的数据同化理论和创新算法,以应用为导向开展基础与应用研究,具有重要的科学意义。
因此,在麻省理工学院做博士后期间,他逐步确立了智能科学计算的研究方向,包括数据同化概率模型、物联网系统、机器学习求解反问题等。
他所提出的基于机器学习的物联网系统,可解决城市基础设施安全与健康监测中的大数据管理、挖掘、实时多尺度指标化状态评测等难题,已成功用于多个实际工程场景中,包括麻省理工学院格林大楼健康监测、科威特第一高楼 AL-Hamra 实时安全监测等。
在美国匹兹堡大学和美国东北大学任终身序列助理教授、独立 PI 后,他领导的研究团队开始致力于机理融合人工智能科学计算理论和方法研究,致力于解决智能科学计算中“知识嵌入”和“知识发现”相关的科学难题。
2021 年,回国加入中国人民大学高瓴人工智能学院。通过系列研究,他与团队运用 AI 从数据中加速解开更多潜在的未知定律,为物理、化学、生物、工程应用等学科问题寻找到更多可靠的理论支撑;同时为跨学科领域关键应用(如实时短龄天气预报、热-磁-流体多物理场模拟、湍流仿真等)提供新的技术支撑。
最近,人工智能大模型异常火热。指出,虽然大模型与智能科学计算看起来有些“相悖”,但也可以从中得到一些启示。
因此,他与团队也在进行一些科学探索,来确认是不是可以在大模型里嵌入人类的逻辑知识、先验知识、已知的定律等,让它的知识推理和逻辑推理的能力变得更强,以帮助人类做一些科学的新探索。
指出,在 AI for Science 层面,智能计算相关理论、模型、方法和技术需要具备如下几个特征:可通用、可解释、可扩展、可泛化、低数据依赖性。未来的发展趋势是在发展和实现具备上述特征的新一代人工智能技术的同时,在解决各跨学科、跨领域相关科学探索和工程问题实现突破。

他表示,未来,在“符号主义”上有所突破,才会真正地实现类似人类的推理能力。因此,未来的发展一定是“连接主义”与“符号主义”并存,协同融合发展,进而形成一种智能科学计算的新范式。

参考资料:

1. .

#In Science We Trust#

小程序/APP:
官网:

热点推荐