【神经网络+数学】——（4）神经网络求解二元偏微分问题（二阶偏微分）

最新推荐文章于 2024-07-22 21:33:56 发布

大数据李菜

最新推荐文章于 2024-07-22 21:33:56 发布

阅读量2.7k

点赞数 1

分类专栏：自研文章标签： python 深度学习神经网络偏微分方程

本文链接：https://blog.csdn.net/BlackValley/article/details/118226871

版权

自研专栏收录该内容

29 篇文章 2 订阅

订阅专栏

背景

前面几篇博客介绍了神经网络应用到积分、一元N阶微分的原理、方法并实践了可行性，取得了较好的拟合效果，现在针对偏微分方程PDE进行最后的攻关，完成该部分攻关后即基本掌握了神经网络应用到方程求解的原理方法以及实践代码的自主可控，其实多元N阶微分如果不是偏微分方程则可表示为（以一阶微分为例）

$\frac{dx}{dt}\frac{dy}{dt}+\frac{dx}{dt}+\frac{dy}{dt}+x(t)+y(t)+2=0$

该种微分方程可通过两分支输出网络来解决(关键代码如下)：

model = Model(inputs=inputs_t,outputs=[outputs_x,outputs_y])
[x,y] = model.predict(t)
loss = sum((x'*y'+x'+y'+x+y+2)**2)

同时在经典的数值方法中，比如有限差分、有限元方法，其刚度矩阵具有稀疏性，但它们的未知数的个数或者网格的节点数随着 PDE 的维度呈指数增长，会出现维数灾难 (Curse of dimensionality, CoD)。谱方法虽然采用了没有紧支集的基函数从而具有指数精度，但是牺牲了稀疏性，而且对函数的光滑性有很高的要求。因而，传统方法在处理高维 PDE 变得特别困难，使用神经网络求解带来了新的思路方法（该部分背景参考知乎）。

问题描述

在这里插入图片描述

定义域（求解区域） $x,y\in[0,1]$

Dirichlet 边界条件:

$\psi(0,y)=y^3$
$\psi(1,y)=(1+y^3)e^{-1}$
$\psi(x,0)=xe^{-x}$
$\psi(x,1)=(x+1)e^{-x}$

用于验证的解析解：
在这里插入图片描述
其中拉普拉斯算子

计算公式为非混合的二阶偏导之和：
（1-D情况）

（2-D情况）在这里插入图片描述

经计算验证，解析解 $\psi$ 对x求二阶偏导加上对y求二阶偏导的结果就是原问题等式，所以下面开始进行模型构建和训练验证。

模型搭建

使用tf2+python3.7环境，自动微分的结果表示微分函数值，训练代码如下（不包含net类的定义代码，需要付费获取，请私信联系博主）：

# 随机打乱
seed = np.random.randint(0, 2021, 1)[0]
input_space_raw = input_space.copy()#save 原序的方便绘曲面图
np.random.seed(seed)
np.random.shuffle(input_space)
output_space = psy_analytic_np(input_space[:, 0], input_space[:, 1])
input_space = tf.reshape(input_space, (-1, input_space.shape[-1]))
input_space = tf.cast(input_space, tf.float32)  # 默认是float64会报错不匹配，所以要转类型
net = PDE_Net(input_space, tf.reduce_min(input_space), tf.reduce_max(input_space), w=w, activation=activation)
if retrain:
    net.model_load()
optimizer = Adam(lr)
for epoch in range(epochs):
    grad, loss, loss_data, loss_equation, loss_border = net.train_step()
    optimizer.apply_gradients(zip(grad, net.trainable_variables))

    if epoch % 100 == 0:
        print("loss:{}\tloss_data:{}\tloss_equation:{}\tloss_border:{}\tepoch:{}".format(loss, loss_data, loss_equation,
                                                                                         loss_border, epoch))
net.model_save()
# plot
output_space = psy_analytic_np(input_space_raw[:, 0], input_space_raw[:, 1])
input_space = tf.reshape(input_space_raw, (-1, input_space_raw.shape[-1]))
input_space = tf.cast(input_space, tf.float32)
predict = net.net_call(input_space).numpy()
fig = plt.figure(figsize=(8, 6))
ax = fig.gca(projection='3d')
ax.plot_surface(input_space_raw[:, 0].reshape(grid, grid), input_space_raw[:, 1].reshape(grid, grid),
                output_space.reshape(grid, grid), cmap=cm.rainbow)
ax.plot_surface(input_space_raw[:, 0].reshape(grid, grid), input_space_raw[:, 1].reshape(grid, grid),
                predict.reshape(grid, grid), cmap=cm.ocean)
plt.title("predictions curve mixed")
plt.show()
fig = plt.figure(figsize=(8, 6))
ax = fig.gca(projection='3d')
ax.plot_surface(input_space_raw[:, 0].reshape(grid, grid), input_space_raw[:, 1].reshape(grid, grid),
                predict.reshape(grid, grid), cmap=cm.rainbow)
plt.title("predictions curve Pred")
plt.show()
fig = plt.figure(figsize=(8, 6))
ax = fig.gca(projection='3d')
ax.plot_surface(input_space_raw[:, 0].reshape(grid, grid), input_space_raw[:, 1].reshape(grid, grid),
                output_space.reshape(grid, grid), cmap=cm.rainbow)
plt.title("predictions curve True")
plt.show()

训练超参配置：

activation = 'tanh'  
grid = 10
epochs = 5000
lr = 0.01
w = (1, 1, 0.001)

训练两次后：
在这里插入图片描述

在这里插入图片描述
最后的日志输出：

loss:2.0242910385131836	loss_data:0.07997725158929825	loss_equation:0.01357131078839302	loss_border:1930.742431640625	epoch:4500
loss:2.6815528869628906	loss_data:0.08011103421449661	loss_equation:0.6714369654655457	loss_border:1930.0048828125	epoch:4600
loss:2.022817850112915	loss_data:0.0801229402422905	loss_equation:0.013348560780286789	loss_border:1929.3463134765625	epoch:4700
loss:2.022118330001831	loss_data:0.08013834059238434	loss_equation:0.013231338933110237	loss_border:1928.74853515625	epoch:4800
loss:2.0260419845581055	loss_data:0.07978630065917969	loss_equation:0.016707584261894226	loss_border:1929.548095703125	epoch:4900
model saved in  net.weights

反复训练调试，先使用0.00001级别的border loss权重又增大到1，极限训练后：
在这里插入图片描述

结论

可见最后两张曲面图近似，说明网络收敛，使用神经网络来求解偏微分方程是可行的，且遵循和求解一元微分方程一样的原理，即通过自动微分来获取方程的各元素，然后利用 $loss = loss_{data} + loss_{equation} + loss_{border}$ 来构造loss用于反向传播更新参数。不过要想把训练精度提上来仍需努力，现阶段收敛所需要的迭代次数太多，100个网格离散点的情况下至少万级的epoch，训练效率很低，而且达到的精度也不是很高。