下载源文件与数据存储
下载源文件 urlretrieve
多用于非结构化的数据(图片等),以下载http://www.pythonscraping.com 上的logo.jpg为例:
'''urlretrieve'''
from urllib.request import urlretrieve
from urllib.request import urlopen
from bs4 import BeautifulSoup
html=urlopen("http://www.pythonscraping.com")
bsObj=BeautifulSoup(html,"html.parser")
imageLocation=bsObj.find("a",id="logo").find("img").attrs["src"]
urlretrieve(imageLocation,"logo.jpg")
'''显示logo.jpg'''
import matplotlib.pyplot as plt # plt 用于显示图片
import matplotlib.image as mpimg # mpimg 用于读取图片
logo = mpimg.imread('logo.jpg')