《深入浅出强化学习编程实战》鸳鸯系统代码+详细注释

本文提供了《深入浅出强化学习编程实战》中鸳鸯系统的完整代码,包括源码、资源文件和load.py。读者需要下载提供的链接资源,以解决运行时可能出现的load_bird_male()错误。运行所有必要文件后,即可体验和学习该强化学习示例。
摘要由CSDN通过智能技术生成

https://download.csdn.net/download/weixin_38594096/36475847https://download.csdn.net/download/weixin_38594096/36475847仅靠书中的代码是不能运行的,会提示无法load_bird_male()

需要下载上面链接中的文件,才可以,里面包括源码+resource(图片文件)+load.py

import pygame
from load import *
import math
import time
import random
from numpy import *
class YuanYangEnv:
    def __init__(self):                          #初始化函数
        self.states=[]                           #定义(S,A,P,R,gama)
        for i in range(0,100):
            self.states.append(i)                #states:0-99
        self.actions=['e','s','w','n']           #动作空间
        self.gamma=0.8                           #折扣因子
        self.value=zeros((10,10))                #值函数
        #渲染属性
        self.viewer=None
        self.FPSCLOCK=pygame.time.Clock()
        self.screen_size=(1200,900)              #窗口大小
        self.bird_position=(0,0)                 #雄鸟当前位置坐标
        self.limit_distance_x=120                #x方向上一次行走像素距离120
        self.limit_distance_y = 90               # y方向上一次行走像素距离90
        self.obstacle_size=[120,90]              #障碍物大小120*90
        self.obstacle1_x=[]                      #障碍物墙1
        self.obstacle1_y = []
        self.obstacle2_x = []                    # 障碍物墙2
        self.obstacle2_y = []
        self.path = []
        for i in range (8):
            self.obstacle1_x.append(360)         #障碍物墙1
            if i<=3:
   
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值