python——简易多线程爬虫实现

最新推荐文章于 2022-05-22 21:38:52 发布

Woo_home

最新推荐文章于 2022-05-22 21:38:52 发布

阅读量396

点赞数

分类专栏： # Python 提高

本文链接：https://blog.csdn.net/Woo_home/article/details/88775906

版权

Python 提高专栏收录该内容

12 篇文章 8 订阅

订阅专栏

多线程爬虫简单爬取网页实例

import multiprocessing
import requests
from requests.exceptions import ConnectionError

def scrape(url):
	try:
		print("爬取%s成功！收到%s"%(url,requests.get(url)))
	except ConnectionError as e:
		print("爬取%s出错！"%(url))
		
if __name__ == '__main__':
	pool = multiprocessing.Pool()   #创建多线程实例
	urls = ['http://www.metro.cn/',  #创建访问的网址列表
			'http://www.shuichan.cc/',
			'http://www.51sole.com/',
			'http://www.x009.com/',
			'http://www.x009.comd/'
			]
	pool.map(scrape,urls) #通过进程池映射方法实现爬虫函数与网址的多进程映射关系

在这里插入图片描述

其中response【200】表示成功获取网页信息，可以获取想要的信息，200为响应的状态码，如果是404就是访问网页失败

正在尝试写博客，把会的分享给你们，如有写的不好的地方，希望指点一下，谢谢！

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Woo_home

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
python——简易多线程爬虫实现

多线程爬虫简单爬取网页实例import multiprocessingimport requestsfrom requests.exceptions import ConnectionErrordef scrape(url): try: print("爬取%s成功！收到%s"%(url,requests.get(url))) except ConnectionError as e...
复制链接

扫一扫