刚学python不久,所以先记录一个爬取图片的方式,并保存本地指定路径下。当然不一定会是最简单的方式,就是习惯这么起标题。但,肯定是我使用起来感觉最简单的。
需要单独安装的第三方模块有三个:
pip install requests
pip intsall BeautifulSoup4
pip install pillow
其它模块都是内建模块,可以直接使用。
具体代码如下:
import requests
from bs4 import BeautifulSoup
from PIL import Image
import os
from io import BytesIO
import time
url = "http://www.yestone.com/gallery/1501754333627"
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"}
r = requests.get(url, headers=headers)
soup = BeautifulSoup(r.content, 'html.parser')
items = soup.find_all('img', class_='img-responsive')
folder_path = './photo'
if os.path.exists(folder_path) == False:
os.makedirs(folder_path)
for index, item in enumerate(items):
if item:
html = requests.get(item.get('data-src'))
img_name = folder_path + str(index + 1) + '.png'
image = Image.open(BytesIO(html.content))
image.save('E:\Python\photo'+img_name)
print('第%d张图片下载完成' % (index + 1))
time.sleep(1) # 自定义延时
print('抓取完成')
然后通过命令行工具执行这个文档
python getimg.py
哈哈,,,恭喜获得想要的图片。