python的EMA曲线平滑方法

李白不是程序员

已于 2022-07-15 09:45:06 修改

阅读量2.3k

点赞数 4

分类专栏：电脑小技巧文章标签：强化学习 DQN 指数移动平均数据平滑 PyTorch

于 2022-07-15 09:32:22 首次发布

本文链接：https://blog.csdn.net/qq_40244048/article/details/125797457

版权

电脑小技巧专栏收录该内容

2 篇文章

订阅专栏

本文介绍了一种使用指数移动平均(EMA)方法来平滑强化学习DQN训练过程中不稳定奖励数据的方法。作者提供了一段简洁的PyTorch代码实现，并展示了平滑效果，强调了通过调整衰减率可以控制平滑程度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

写在前面

最近用到了强化学习（DQN），可这东西训练的结果实在是不够稳定，reward波动性极强。肉眼是能看出来reward有上升趋势的，但是不是很明显，还是得做一下曲线平滑。

网上查了很多ema的方法，但是大多都是用在模型当中的，我就是只想做个简单的数据平滑而已啊，没必要大动干戈，如果有什么一行的代码给我最好不过了。其实我也查了，scipy的包中有实现数据平滑的方法，但我试了一下，还挺麻烦的。不如直接写一个简单程序造福大众。

因为我的主程序使用pytorch写的，所以代码中我也用了pytorch，有需要的朋友需要手动变更为numpy的，其实也很简单。

我定义了一个ema函数，其实ema的原理是

ema数据=衰减率*当前数据+(1-衰减率)*下个数据。

知道原理之后我们就可以通过for循环很简单的实现ema了。

import matplotlib.pyplot as plt
import torch


def ema(data, decay=0.85):
    new_data = torch.zeros(data.shape[0])
    new_data[0] = torch.mean(data[:2])
    for idx in range(len(data) - 1):
        new_data[idx+1] = decay * new_data[idx] + (1 - decay) * data[idx + 1]
    return new_data


a = torch.randn(100)
b = ema(a)


plt.figure()
plt.plot(a, label='real')
plt.plot(b, label='ema data')
plt.legend(loc='best')
plt.show()

下面是效果图，设置deacy的大小可以调整平滑的程度。这里我设置的0.85，你可以自己调整一下试试。