**
利用py的requests库爬取图片
代码如下
import requests
import re
def getHtml(url):
try:
r=requests.get(url)
r.raise_for_status()
r.encoding='utf-8'
print(r.text)
return r.text
except:
return ""
def getImg(html):
#reg=r'src="(http.+?\.jpg)"'
reg=r'src="(http.+?\.jpg)"'
imglist=re.findall(reg,html)
print(imglist)
i=0
for url in imglist:
with open(".\\wb\\"+str(i)+".jpg","wb") as fd:
#response=requests.get(url)
response = requests.get(url)
fd.write(response.content)
print(i,response.content)
print('图片',i,"保存成功\n")
i+=1
html = getHtml("https://www.tupianzj.com/meinv/mm/pxmnt/")
getImg(html)
这个网站有点正能量(补代码解释:挺简单应该都能看懂,简单说一下:)
getHTML介函数就是获取当前网页的源码,getImg介函数先编写了正则表达式,然后在网页源码上边找到像reg那样的(就是找到很多个图片链接)然后循环列表逐个以二进制形式存入文件里边。