(8-5)Dueling DQN 算法:股票交易策略系统(3)

8.3.6  Double DQN算法实现

Double DQN(双重深度Q网络)改变了目标网络的Q值计算方式,解决了DQN算法中的Q值过高估计问题,可以与Dueling DQN算法结合使用,以提高模型的整体性能。

(1)实现基于Double DQN(双重深度 Q 网络)算法的训练,其中 Q 网络和目标网络之间采用了特定的更新策略来减轻 Q 值过高估计问题。具体实现代码如下所示。

def train_ddqn(env):

    # 定义 Q 网络的类
    class Q_Network(chainer.Chain):

        def __init__(self, input_size, hidden_size, output_size):
            super(Q_Network, self).__init__(
                fc1 = L.Linear(input_size, hidden_size),
                fc2 = L.Linear(hidden_size, hidden_size),
                fc3 = L.Linear(hidden_size,
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

码农三叔

感谢鼓励

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值