今天学习了下 well2049的博客中的图片抓取和保存的实例。点击打开链接。
对其中的代码进行了修改优化,目的是检验html.parser 和 lxml 解析快慢问题(下图来自崔大神的爬虫教程)。顺便设置下载数量限制。
源代码参考上面链接。
修改后的代码参考下文。
import requests
from bs4 import BeautifulSoup
from PIL import Image
import os
from io import BytesIO
import time
start = time.clock() # 自行添加程序运行计时功能。
url =