【深度学习驱动流体力学】采集OpenFOAM仿真的流体力学数据送入到强化学习DQN模型训练

源代码杀手

于 2024-06-20 15:08:02 发布

阅读量590

点赞数

分类专栏：深度学习驱动流体力学文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41194129/article/details/139833276

版权

深度学习驱动流体力学专栏收录该内容

45 篇文章 ¥99.90 ¥299.90

订阅专栏

目录

技术原理
训练记录
参考

技术原理

1. 数据准备与环境构建

首先，数据从VTK文件中读取并处理，这些文件包含流体速度场数据。通过PyVista库提取速度场信息，并将其存储在NumPy数组中。数据集随后被划分为训练集和测试集，用于模型训练和验证。我们定义了一个强化学习环境FluidEnvironment，该环境使用流体数据来模拟每个时间步的状态转换。环境的reset方法重置模拟到初始状态，而step方法根据动作更新环境状态，返回新的状态、奖励和是否结束等信息。奖励函数基于当前状态和动作之间的均方误差（MSE），负奖励鼓励模型减少误差。

2. DQN模型的设计与训练

DQN（深度Q网络）模型的核心是使用神经网络来逼近Q值函数。Q值函数用于评估在给定状态下采取特定动作的预期回报。模型结构包括三个全连接层（Dense层），前两层使用ReLU激活函数以增加模型的非线性表示能力。第三层输出Q值，它的大小等于动作空间的维度。在训练过程中，使用经验回放技术存储过去的经验（状态、动作、奖励、下一状态、是否终止），并从中随机采样小批量数据进行训练。目标Q值通过贝尔曼方程计算，并使用均方误差（MSE）损失

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

源代码杀手 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。