#下载网页 import urllib.request import re def pageDown(url): page=urllib.request.urlopen(url) return page.read().decode("utf-8") #解析网页,存储到文件 def parseAndSave(): str='src="(.*\.jpg)"'#正则表达式 reg=re.compile(str) #解析出来的图片地址 imgList=re.findall(reg,page) n=0 try: for imgPath in imgList: urllib.request.urlretrieve(imgPath,"z2/%s.jpg"%(n)) n+=1 except: print("下载失败") raise #主函数调用 if __name__=="__main__": page=pageDown("https://tieba.baidu.com/f?kw=%E7%BE%8E%E5%A5%B3&ie=utf-8&tab=album") print(page) parseAndSave()
python爬虫(解析图片)
最新推荐文章于 2024-05-10 02:00:47 发布