[7]个人学习python：爬取百度贴吧图片，并保存到本地目录

最新推荐文章于 2022-01-01 20:05:36 发布

tangxiaoguodong

最新推荐文章于 2022-01-01 20:05:36 发布

阅读量534

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/deepmountain/article/details/80481103

版权

python 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

代码如下：

# -*- coding: utf-8 -*
import urllib.request,re
url='http://tieba.baidu.com/p/5665019988/'
page=urllib.request.urlopen(url,timeout = 2)
html=page.read()
html=html.decode('utf-8')                        #因为百度不是utf-8，故需要转码
reg=r'src="(http://imgsrc.baidu.com/forum/w%3D580/sign=[^\s]*?\.jpg)"'  #此处指定是http://imgsrc.baidu.com/forum/w%3D580/sign=地址开头的图片，并作为字符串
imger=re.compile(reg)                              # re.compile()函数用于编译正则表达式，生成一个‘正则表达式对象’
imglist=re.findall(imger,html)                     # re.findall()在字符串中找到‘正则表达式对象’所匹配的所有子串，并返回一个列表，如果没有找到匹配的，则返回空列表
n=0
for imgurl in imglist:
    urllib.request.urlretrieve(imgurl,r'C:\\Users\\Administrator\\PycharmProjects\\untitled\\venv1\\image\\%s.jpg'%n)
    n=n+1

结果如下：