力学所的郭永怀力学进展讲座笔记
仅作个人笔记分享用途。如有侵权,请联系我删除。
Ref:
Machine Learning and Physics-based Modeling-Weinan E
《郭永怀力学进展》讲座-主讲人:鄂维南院士
- ppt我进行了一个简单的翻译,下载地址
1 物理模型PDE
科学研究的两项基本主题:寻求基本原理与解决实际问题
- 从基本原理解决实际问题的三种方法:
1. 简化模型:
要表达物理世界的基本规律;
不能违反基本的物理限制;
大致普适准确;
有物理意义
(比如空气动力学里的欧拉方程;反例:广义的欧拉方程)
- 如何简化模型?
物理方法&数学方法
2.数值方法:
根本地改变科研的方法,尤其在工程领域
对于低维问题解决的比较好,但是对于高维问题以及多个自由度(湍流、N-S)解决得不好
↑原因:维数灾难CoD
3.多尺度方法:
基本思想:借助微观模型解决宏观问题 - 很多问题仍待解决
- 新想法:机器学习解决维数灾难的表现不错,引入ML解决以上问题?
借助ML来发展一些可解释、可靠的物理模型
2 机器学习介绍
- 目标:尽量逼近目标函数。根据目标函数的函数值是离散/连续分为分类问题/回归问题
数据集划分:训练&测试集 - ML逼近与经典逼近的差别:
经典逼近对于高维完全无效 - Monto Carlo方法避免了维数灾难
- 把机器学习根据有无维数灾难分为两类:误差表达式是否包含变量d
3
- 目标:微观的物理模型→利用机器学习→一个简化的宏观模型
- 本目标与常见的ML问题的区别性:
通常的机器学习问题,数据集是给定的,比如Cifar;但是我们这里只有微观的物理模型,没有数据 - 下个定义以便区分:
- sequential learning:先收集数据再进行学习
- concurrent learning:数据生成与学习一同进行,“on the fly”的。通过生成的数据improve学习
这与多尺度模型里的划分概念是一致的
- 鄂维南院士的工作:“ELT”
- exploration: 准备数据;先决定这个数据是否需要进行label
- labeling:准备数据
- training:
目标——获得一个最优的、具有绝对代表性的数据集,同时数据量尽可能小(减少计算成本)
- 下面将给出两个ML的concurrent的例子
4 分子动力学
- 传统困境
- 新的范式:
思路就是用量子力学来产生数据,ML来建造模型
- 鄂院士的工作:Deep Potential
整个神经网络是由N个尺度网络合成的,N就是分子的个数
(后面内容不做笔记了哈,不是搞固体的也不太看得懂,感兴趣的直接看ppt就行,很清楚)
5 空气动力学的动力学模型
Kn克努森数:分子自由程/特征长度,衡量是否复合连续介质假设
根据Kn的不同,可以划分如下:
我们渴望找到一个像欧拉方程一样简洁统一的模型
以玻尔兹曼方程为例,
当Kn较大的时候该怎么解决?
-
对于传统的方法,可以概括为以下三个步骤:
最终采用一些简化假设,忽略高阶矩等来闭合这个模型系统 -
用ML模型怎么做?
1、用自编码器学习,编码器用来生成最优的moments:W,解码器用来由U、W反推原始函数f
最小化以下的函数找到最优的moments:
玻尔兹曼方程同理如下继续训练
综上,整个算法的思路如下:
【ps.细节问题去看他今年的论文】
最终的这个优化精度如图:
6 总结
1、机器学习与物理建模结合可以打开目前科学研究的新局面
2、concurrent learning的优势
3、不是仅仅在开发“算法”,引入对于物理意义的理解与可解释性,可以直接带我们寻找出新的物理模型