Educoder 第1关：多线程、多进程爬虫

小施没烦恼

已于 2023-11-22 21:49:13 修改

阅读量1.8k

点赞数

分类专栏： Educoder题目解析文章标签： python

于 2021-06-18 23:43:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46026136/article/details/118035603

版权

Educoder题目解析专栏收录该内容

11 篇文章 28 订阅 ¥9.90 ¥99.00

订阅专栏

本文介绍了在Educoder平台上完成的第一关挑战，聚焦于使用Python实现多线程和多进程的网络爬虫技术。通过实战，探讨了如何通过并发提升爬虫效率，同时涉及到了Python的线程模块和进程模块的运用。

摘要由CSDN通过智能技术生成

import requests
from lxml import etree
import time
from concurrent.futures import ThreadPoolExecutor, ProcessPoolExecutor
from multiprocessing import Pool
import os
import threading
import psutil
# URL伪装
header = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36",
}
def downimg(img_src):
    start_time = time.time()
    
    name = img_src.split('/')[-1].split('.')[0]
    img_url = "http://127.0.0.1:8080" + img_src
    img = requests.get(img_url)
    dir_path = 'step1/images'
    if not os.path.exists('step1/images'):
        os.makedirs('step1/images')
    img_path = 'step1/images'

了解本专栏

小施没烦恼

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

小施没烦恼 CSDN认证博客专家 CSDN认证企业博客

码龄5年

35: 原创

9万+: 周排名

156万+: 总排名

5万+: 访问

: 等级

506: 积分

209: 粉丝

114: 获赞

24: 评论

279: 收藏

私信

关注

热门文章

分类专栏

最新评论

Educoder：MySQL数据库编程
CharerChou: 你看他的，多了一个头文件，全部粘过去就行了
educoder警务大数据之离线存储
CSDN-Ada助手: 非常棒的博客！educoder警务大数据之离线存储是非常热门和有前途的话题。我们期待能够看到更多关于警务大数据方面的高质量博客。如果你正在寻找下一个主题，我们建议你写一篇博客探讨“使用人工智能技术分析警务大数据”，这将是一个非常有趣和前沿的话题。期待你的下一篇博客！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
Educoder 第1关：多线程、多进程爬虫
qinddengyeiyou: 我运行第一下报错好像是回车什么的，找了好就，运行第二下就成功了
Educoder 第1关：多线程、多进程爬虫
qinddengyeiyou: 运行两下
Educoder 第1关：多线程、多进程爬虫
Аблиз-: 好想还是不对

大家在看

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小施没烦恼 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。