python爬取图片的库_[python学习] 简单爬取图片站点图库中图片

weixin_39644611

于 2020-12-18 02:18:06 发布

阅读量115

点赞数

文章标签： python爬取图片的库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39644611/article/details/111455224

版权

本文介绍了如何使用Python进行图片爬取，通过遍历游讯网的图片列表页面，获取每个主题的URL，并进一步提取图片链接。示例代码展示了利用urllib、re和os库实现这一过程，帮助读者理解Python爬虫抓取图片的基本步骤。

摘要由CSDN通过智能技术生成

# coding=utf-8

# 声明编码方式默认编码方式ASCII 參考https://www.python.org/dev/peps/pep-0263/

import urllib

import time

import re

import os

'''

Python下载游迅网图片 BY:Eastmount

'''

'''

**************************************************

#第一步遍历获取每页相应主题的URL

#http://pic.yxdown.com/list/0_0_1.html

#http://pic.yxdown.com/list/0_0_75.html

**************************************************

'''

fileurl=open('yxdown_url.txt','w')

fileurl.write('****************获取游讯网图片URL*************\n\n')

#建议num=3 while num<=3一次遍历一个页面全部主题,下次换成num=4 while num<=4而不是1-75

num=3

while num<=3:

temp = 'http://pic.yxdown.com/list/0_0_'+str(num)+'.html'

content = urllib.urlopen(temp).read()

open('yxdown_'+str(num)+'.html','w+').write(content)

print temp

fileurl.write('****************第'+str(num)+'页*************\n\n')

#爬取相应主题的URL

#

count=1 #计算每页1-75中详细网页个数

(.*?

'

m_div = re.findall(res_div,content,re.S|re.M)

for line in m_div:

最低0.47元/天解锁文章

weixin_39644611

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。