python统计窗口函数_python – 加速滑动窗口平均计算

最新推荐文章于 2024-05-08 20:59:08 发布

weixin_39783360

最新推荐文章于 2024-05-08 20:59:08 发布

阅读量802

点赞数 1

文章标签： python统计窗口函数

我有一些数据(股票数据),需要通过对该数据进行一些计算来操纵它.我用numpy数组做了. Numpy比python内置函数快得多.但是,我的代码的执行时间高于预期.我的代码在下面,我用ipython％timeit函数测试它.结果是这样的：总执行时间是5.44毫秒,第二个“for”循环占用大部分时间3.88毫秒,并且导致该循环中的’np.mean’函数.因此,’np.mean’的替代方案和任何其他加快执行时间的建议都会有所帮助.

码

data = my_class.Project.all_data["AAP_data"]

data = np.array(data[["High", "Low", "Close"]])

true_range = np.empty((data.shape[0]-1, 1))

for i in range(1, true_range.shape[0]+1):

true_range[i-1] = max((data[i, 0] - data[i, 1]), (abs(data[i, 0] - data[i-1, 2])),

(abs(data[i, 1] - data[i-1, 2])))

average_true_range = np.empty((true_range.shape[0]-13, 1))

for i in range(13, average_true_range.shape[0]+13):

lastn_tr = true_range[(i-13):(i+1)]

average_true_range[i-13] = np.mean(lastn_tr)

解决方法:

这基本上是滑动窗口平均计算.这种平均可以被认为是滑动窗口中的求和并除以窗口大小的长度.因此,我们可以使用1D convolution和np.convolve的矢量化解决方案来摆脱整个循环过程,给我们average_true_range,就像这样 –

np.convolve(true_range,np.ones((14),dtype=int),'valid')/14.0

为了进一步提升性能,我们可能从研究CPU如何在乘法中比分段更有效的方法中学到了.所以,让我们在这里使用它来改进版本 –

r = 1.0/14

out = np.convolve(true_range,np.ones((14),dtype=int),'valid')*r

运行时测试 –

In [53]: def original_app(true_range):

...: average_true_range = np.zeros((true_range.shape[0]-13, 1))

...: for i in range(13, average_true_range.shape[0]+13):

...: lastn_tr = true_range[(i-13):(i+1)]

...: average_true_range[i-13] = np.mean(lastn_tr)

...: return average_true_range

...:

...: def vectorized_app(true_range):

...: return np.convolve(true_range,np.ones((14),dtype=int),'valid')/14.0

...:

...: def vectorized_app2(true_range):

...: r = 1.0/14

...: return np.convolve(true_range,np.ones((14),dtype=int),'valid')*r

...:

In [54]: true_range = np.random.rand(10000) # Input array

In [55]: %timeit original_app(true_range)

1 loops, best of 3: 180 ms per loop

In [56]: %timeit vectorized_app(true_range)

1000 loops, best of 3: 446 µs per loop

In [57]: %timeit vectorized_app2(true_range)

1000 loops, best of 3: 401 µs per loop

那里有大规模的加速！

稍后,瓶颈可能会转移到获得true_range的第一部分.要在那里进行矢量化,这是一种使用切片的方法 –

col0 = data[1:,0] - data[1:,1]

col1 = np.abs(data[1:,0] - data[:-1,2])

col2 = np.abs(data[1:,1] - data[:-1,2])

true_range = np.maximum(np.maximum(col0,col1),col2)

标签：python,arrays,performance,numpy,vectorization

weixin_39783360

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python统计窗口函数_python – 加速滑动窗口平均计算

我有一些数据(股票数据),需要通过对该数据进行一些计算来操纵它.我用numpy数组做了. Numpy比python内置函数快得多.但是,我的代码的执行时间高于预期.我的代码在下面,我用ipython％timeit函数测试它.结果是这样的：总执行时间是5.44毫秒,第二个“for”循环占用大部分时间3.88毫秒,并且导致该循环中的’np.mean’函数.因此,’np.mean’的替代方案和任何其他加...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。