强化学习:Gym中的EzPickle类解析

类所在位置:gym\utils\ezpickle.py

为什么要设计 EzPickle?

1. pickle 是实现 Python 对象序列化的库

2. 但是有一些对象无法被序列化,如:数据库连接,打开的网络套接字,正在运行的线程等。

3. 如何选择想要序列化的范围?

4. 通过双下方法(dunder method)中的 __getstate__ 方法。如果不重写__getstate__(),则会使用默认实例的__dict__。

5. EzPickle 中重写了__getstate__()和__setstate__(),通过构造器参数(*args,**kwargs)实现序列化和反序列化强化学习的环境。

class EzPickle:
    """Objects that are pickled and unpickled via their constructor arguments."""

    def __init__(self, *args, **kwargs):
        """Uses the ``args`` and ``kwargs`` from the object's constructor for pickling."""
        self._ezpickle_args = args
        self._ezpickle_kwargs = kwargs

    def __getstate__(self):
        """Returns the object pickle state with args and kwargs."""
        return {
            "_ezpickle_args": self._ezpickle_args,
            "_ezpickle_kwargs": self._ezpickle_kwargs,
        }

    def __setstate__(self, d):
        """Sets the object pickle state using d."""
        out = type(self)(*d["_ezpickle_args"], **d["_ezpickle_kwargs"])
        self.__dict__.update(out.__dict__)

如何使用 ExPickle?

以CarRacing为例,继承gym.Env 与 EzPickle。
class CarRacing(gym.Env, EzPickle):

参考文献

【1】python pickle module:picklable and unpicklable types

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值