Dueling DQN 跑 Pendulum-v1

NoahBBQ

于 2023-12-13 23:05:08 发布

阅读量492

点赞数 9

分类专栏： RL 文章标签： pytorch gym Dueling DQN Pendulum-v1

本文链接：https://blog.csdn.net/NoahBBQ/article/details/134984063

版权

RL 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

gym-0.26.1
Pendulum-v1
Dueling DQN

因为还是DQN,所以我们沿用double DQN,然后把 Qnet 换成 VAnet。
其他的不变，详情参考前一篇文章。

class VA(nn.Module):
    """只有一层隐藏层的A网络和V网络"""
    def __init__(self, state_dim, hidden_dim, action_dim):
        super().__init__()
        self.fc1 = nn.Linear(state_dim, hidden_dim)
        self.fc_A = nn.Linear(hidden_dim, action_dim)
        self.fc_V = nn.Linear(hidden_dim, 1)
    
    def forward(self, X):
        A = self.fc_A(F.relu(self.fc1(X)))
        V = self.fc_V(F.relu(self.fc1(X)))
        Q = V + A - A.mean(1).reshape(-1,1)
        return Q