接上一篇博客,传送门:爬取代理IP(1)
本文是个人练习心得分享,若有错误,还望指正
多线程验证代理IP
考虑到这个程序最耗时的部分是验证IP(因为有大量的IP不能使用,等待响应请求的时间很长),所以考虑用多线程来完成IP的验证。
1.导入必要的包
from concurrent.futures import ThreadPoolExecutor
这个是使用多线程处理常用包,可以生成线程池
2.线程池的使用
首先是打开线程池,mxw 是一个自定义的变量,用于设置最大线程数,这里默认为 10
#创建线程池
with ThreadPoolExecutor(max_workers = mxw)<