线程和进程各自有什么区别和优劣呢?
-
进程是资源分配的最小单位,线程是程序执行的最小单位。
-
进程有自己的独立地址空间,每启动一个进程,系统就会为它分配地址空间,建立数据表来维护代码段、堆栈段和数据段,这种操作非常昂贵。而线程是共享进程中的数据的,使用相同的地址空间,因此CPU切换一个线程的花费远比进程要小很多,同时创建一个线程的开销也比进程要小很多。
-
线程之间的通信更方便,同一进程下的线程共享全局变量、静态变量等数据,而进程之间的通信需要以通信的方式(IPC)进行。不过如何处理好同步与互斥是编写多线程程序的难点。
-
但是多进程程序更健壮,多线程程序只要有一个线程死掉,整个进程也死掉了,而一个进程死掉并不会对另外一个进程造成影响,因为进程有自己独立的地址空间。
进程
1.1、双进程间通讯Pipe()
import multiprocessing
import os,time,random
#双进程间通讯
#发送
def proc_send(p,urls):
for url in urls:
print('当前进程(%s) 发送:%s。' % (os.getpid(),url))
p.send(url)
time.sleep(random.random())
#接收
def proc_recv(p):
while True:
print("当前进程(%s)接收 %s"% (os.getpid(),p.recv()))
if __name__ == "__main__":
p = multiprocessing.Pipe()
p1 = multiprocessing.Process(target=proc_send, args=(p[0], ['url_'+str(i) for i in range(10)]))
p2 = multiprocessing.Process(target=proc_recv, args=(p[1], ))
#启动子进程p1、2
p1.start()
p2.start()
p1.join()
p2.join()
print('主程序结束。。。。')
- 运行结果
1.2、多进程间通讯Queue()
from multiprocessing import Process,Queue
import os,time,random
#多进程间通讯
#写数据进程执行代码
def proc_write(q,urls):
print('进程(%s) 正在写入。。。' % os.getpid())
for url in urls:
q.put(url)
print("put插入 %s 进入进程" % url)
time.sleep(random.random())
#读数据进程执行代码
def proc_read(q):
print("进程(%s) 正在读取" % os.getpid())
while True:
url = q.get(True)
print("get获取(%s)来自进程"% url)
if __name__ == "__main__":
# 父进程创建queue,并传给各个子进程
q = Queue()
p1 = Process(target=proc_write, args=(q, ['hhhh_1', 'hhh_2', 'hhh_3']))
p2 = Process(target=proc_write, args=(q, ['url_4', 'url_5', 'url_6']))
p_r = Process(target=proc_read, args=(q,))
#启动子进程p1、2写入,p_r读取
p1.start()
p2.start()
p_r.start()
#等待proc_write结束
p1.join()
p2.join()
#p_r进程里是死循环,无法等待结束,只能终止
p_r.terminate()
print('主程序。。。。')
- 运行结果
线程
2.1、threading模块,创建Tread实例
- 运行结果
2.2从threading.Tread继承创建线程类
- 运行结果