一、开发环境
Windows10 + PyCharm Community 2018.1.4
二、开整
先交代下,本人平时比较喜欢看知乎,因为知乎上干货多,这不最近迷上了给手机换壁纸,恰巧知乎上这个问题下https://www.zhihu.com/question/64252714/answer/272394399有很多好看的壁纸,以前我都是一张一张地保存,超累的最近在学习Python3,在网上找了些例子学到了点皮毛,于是想做个小小的爬虫,把该答案下的壁纸爬下来。好,说干咱就干!
以下是代码放送~
from urllib import request #从urllib库里导入request模块
from bs4 import BeautifulSoup #从BeautifulSoup4(bs4)库里导入BeautifulSoup模块
import re #导入正则表达式模块re模块
import time #导入time模块
url = "https://www.zhihu.com/question/64252714"
html = request.urlopen(url).read().decode('utf-8')
soup = BeautifulSoup(html, 'html.parser')
links = soup.find_all('img', 'origin_