tf/encoder|Error合集

1. pickle & pandas

AttributeError: Can't get attribute '_unpickle_block' on <module 'pandas._libs.internals' from '/rds/general/user/xy823/home/anaconda3/envs/test_DQN3_7/lib/python3.7/site-packages/pandas/_libs/internals.cpython-37m-x86_64-linux-gnu.so'>

解决:.pkl文件压缩的pandas和解压缩的pandas必须是同一个版本。

2. tf.reduce_mean

tf.math.reduce_mean(
    input_tensor, axis=None, keepdims=False, name=None)

用于计算张量tensor沿着指定的数轴(tensor的某一维度)上的的平均值,主要用作降维或者计算tensor(图像)的平均值。

axis=0:按照列平均

axis=1:按照行平均

区分:tf.reduce_mean & np.mean

几乎等价,np.mean由dtype参数确定输出的数据类型(默认是float64),但  tf.reduce_mean 中输出参数的类型默认与input_tensor一致

3. Leaky ReLU 和 ReLU

Leaky ReLU Explained | Papers With Code

Leaky ReLU在负数部分有一个较小的斜率,目的是处理稀疏梯度的情况(sparse gradients),比如在训练生成对抗网络时

ReLU:

f\left(x\right) = \max\left(0, x\right)

4. one-hot encoding独热编码

https://www.tensorflow.org/api_docs/python/tf/one_hot

Tensorflow 独热向量,tf.one_hot() 一看就明白的解释 - 知乎

machine learning - What is one hot encoding in tensorflow? - Data Science Stack Exchange

tf.one_hot(
    indices,
    depth,
    on_value=None,
    off_value=None,
    axis=None,
    dtype=None,
    name=None
)

用于映射类别特征categorical feature成为类似二进制的编码

5. DQN, double DQN,Dueling DQN, Dueling Double DQN

5.1 DQN

target 

r+\gamma maxQ_{_{target}}(s',a')-Q_{model}(s,a) (1)

5.2 double DQN

r+\gamma Q_{_{2nd}}[s',argmax^{_{a'}}Q_{1st}(s',a')] (2)

5.3 Dueling DQN

Q(s,a)=V(s)+A(s,a)

Q(s,a)=V(s)+A(s,a)-\frac{1}{n}\sum_{a'}^{}A(s,a') (3)

5.4 Dueling Double DQN

https://www.freecodecamp.org/news/improvements-in-deep-q-learning-dueling-double-dqn-prioritized-experience-replay-and-fixed-58b130cc5682/

for trainning, use(2)

combine resultes,use(3)

  • 7
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值