最近初学python爬虫,就写了一个爬取网站图片的小工具,界面如下:
用到的包主要是爬虫常用的urllib,urllib2和图形界面用的Tkinter,完整代码如下:
# -*- coding:utf-8 -*-
# coding=UTF-8
import os,urllib,urllib2,re
from Tkinter import *
import tkMessageBox
import tkFileDialog
url = u"https://www.baidu.com/"
path = "D:\图片采集/"
def getHtml(url):
webfile = urllib.urlopen(url)
outhtml = webfile.read