最近用空闲时间随手写了个抓取网站图片的图形化界面程序,已经开源于GitHub,地址如下:https://github.com/code-nick-python/scrapy-images,今天给大家解析一下这个程序:
#引入爬虫库
from bs4 import BeautifulSoup
import requests
#引入其他库
import time
import os
import validators
#引入tkinter系列库
import tkinter
import tkinter.messagebox
from tkinter.filedialog import askdirectory
#选择文件夹的函数
def selectPath():
path_ = askdirectory()
path.set(path_)
#使用第三方库判断是否为url
def is_url(url):
if validators.url(url)==True:
return True
else:
return False
#爬虫主程序
def scrapy():
#从输入框中获取网址和存储地址
url=link_entry.get()
path=save_entry.get()
#尝试请求
try:
response = requests.get(url, timeout=20)
#请求失败弹出错误框
except:
tkinter.messagebox.showerror('wrong!','can not get the url\n请求网址失败')
return
#解析网页找到图片
soup = Beau