2020年10月14日：最近几天复现论文踩坑记录

最新推荐文章于 2022-04-07 22:58:20 发布

SpadeA_Iverxin

最新推荐文章于 2022-04-07 22:58:20 发布

阅读量176

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/KuXiaoQuShiHuai/article/details/109081250

版权

14 篇文章 2 订阅

订阅专栏

最近踩的坑：

在ddpg算法类的actor网络中输入1个state来获取action，要扩展成batch_size为1的tensor。否则出来的维度不同，导致后面计算熵出错。出错还好，就是怕不报错，就需要慢慢排查。
对于target类网络，不需要使用梯度更新的，可以关掉梯度来节省内存提高速度。

iterator.chain()返回的迭代器只能使用一次，for循环后将失效。需要重新创建迭代器。（因为这个原因导致critic的网络没有被更新）

l1 = [1,2,3]
l2 = [4,5,6]
l1_l2 = itertools.chain(l1,l2)
for i in l1_l2:
    print(i)
# l1_l2使用后失效。
for i in l1_l2:
    # 无法进入
    print(i*0.1)

np.where(c, x, y) 如果满足条件c，则返回x，否则返回y

np.where( c ) 返回满足条件c的坐标。

例如，

a = np.random.uniform(size = 10) # 随机生成均一分布的10个0~1之间的数组
np.where(a<0.8) #返回所有小于0.8的坐标。长度不一定，根据多少定。

numpy:

# 假设a是一个(1,50,10)的数组。
a[0, [1,2,3]] # 返回的是dim0里面坐标为1,2,3的元素。即返回的是一个(3,10)的数组。

算法相关：

不一定需要正则化，也可以训练出来好的结果。根据实际情况定。一旦对输入的数据进行了正则化，那么在测试新的数据时，就需要使用原来正则化所使用的均值和方差，否则结果会有问题。
如果想要保证网络每次初始化的参数都相同，在pytorch中网络的__init__可以使用torch.manual_seed(seed)设置随机种子，这样在每次创建的网络初始权重都一样。

关注