python并行计算for循环_如何在python中并行化嵌套的for循环?

本文介绍了如何在Python中利用multiprocessing库并行化嵌套的for循环,以提高计算效率。通过创建进程池并分配任务,避免了单进程执行时的时间消耗。每个进程独立计算dist[i,p]并将其写入不同的文件,确保数据不会冲突。随着数据规模增大,加速效果将更加显著。" 137850030,20178736,Docker部署Nacos不使用数据库详解与Golang面试指南,"['docker', 'nacos', 'golang']
摘要由CSDN通过智能技术生成

启动一个进程会有很小的开销(50ms+取决于数据大小),因此通常最好尽可能多地使用最大的代码块。从您的评论看来,t的每个循环都是独立的,因此我们应该可以自由地并行化它。在

当python创建一个新进程时,您将获得主进程的一个副本,这样您就可以使用所有全局数据,但是当每个进程写入数据时,它会写入自己的本地副本。这意味着dist[i,p]将不可用于主进程,除非您显式地用一个return返回它(这将有一些开销)。在您的情况下,如果每个进程将dist[i,p]写入一个文件,那么您应该没问题,只是不要尝试写入同一个文件,除非您实现了某种类型的互斥访问控制。在#!/usr/bin/python

import time

import multiprocessing as mp

import numpy as np

data_Y = 11 #11000

data_I = 90 #90000

dist_n = 100

nrm = np.linspace(1,10,dist_n)

I = np.random.randn(data_I, 1000)

Y = np.random.randn(data_Y, 1000)

dist = np.zeros((data_I, dist_n))

def worker(t):

st = time.time()

for i in range(data_I):

d = np.abs(I[i] - Y[t])

for p in range(dist_n):

dist[i,p] = np.sum(d**nrm[p])/nrm[p]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值