#导入urllin.request包
import urllib.request#创建完整的url(要访问的网站,例如百度)
url = 'http://www.baidu.com'#发送请求得到响应
response = urllib.request.urlopen(url)#可以得到响应的状态码
print(response.status)#可以获得响应头信息
print(response.headers)#得到请求的url
print(response.url)#获得网页内容,但是字节格式
content = response.read()#要对得到的字节内容进行解码,得到字符串
content = content.decode('utf-8') #字符格式可能不一样,具体情况选取合适的#将得到的内容存入文件中
with open('content.txt','w',encoding='utf-8') as fp:
fp.write(content)
#也可以得到图片#创建一个图片的完整url
url = "https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1540216805401&di=68f956690ad56f4b4b0a35705d395478&imgtype=0&src=http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FxwQHtLwKNlLr10wbH0VMibOnQ52icnhsDdFjx0lJop3L742qWudiclSsMMwW4DrTGx34lia7fOibMTeIcdQTmPibpGMw%2F0.jpeg"#发送请求得到响应
response_img = urllib.request.urlopen(url)#获得图片,但是字节格式
content_img = response_img.read()#将图片的二进制信息存入文件中,打开这个文件就可以访问这个图片
#要选wb存入文件中的必须是二进制信息
with open("content_img.jpg",'wb') as img:
img.write(content_img)
#有一个简便方法可以快速的存入图片,第一个参数为图片的url,第二个参数为文件的路径
urllib.request.urlretrieve(url,'urlretrieve.jpg')
python urllib.request
最新推荐文章于 2024-04-23 16:42:17 发布