urllib模块

本文介绍了Python3的urllib模块,包括urllib.request模块的urlopen方法和Request对象,用于发送HTTP请求,以及如何处理Cookie。同时讲解了urllib.parse模块的quote、urlencode和urlparse方法,用于URL处理。最后提到了urllib.error模块,用于处理HTTPError和URLError异常。
摘要由CSDN通过智能技术生成

1. urllib模块

1.1 urllib简介

urllib 是 Python3 中自带的 HTTP 请求库,无需复杂的安装过程即可正常使用,十分适合爬虫入门

urllib 中包含四个模块,分别是:

request:请求处理模块

parse:URL 处理模块

error:异常处理模块

robotparser:robots.txt 解析模块

1.2 urllib使用

1.2.1 request 模块

request模块是urllib中最重要的一个模块,一般用于发送请求和接收响应

(1)urlopen 方法

 
  1. urllib.request.urlopen()

urlopen 方法无疑是 request 模块中最常用的方法之一,常见的参数说明如下:

url:必填,字符串,指定目标网站的 URL

data:指定表单数据

  该参数默认为 None,此时urllib使用GET方法发送请求

  当给参数赋值后,urllib使用POST方法发送请求,并在该参数中携带表单信息(bytes 类型)

timeout:可选参数,用来指定等待时间,若超过指定时间还没获得响应,则抛出一个异常

  该方法始终返回一个HTTPResponse对象,HTTPResponse对象常见的属性和方法如下:

geturl():返回 URL

getcode():返回状态码

getheaders():返回全部响应头信息

getheader(header):返回指定响应头信息

read():返回响应体(bytes 类型),通常需要使用decode('utf-8')将其转化为str类型

 
  1. import urllib.request
  2.  
  3. def load_data():
  4. url = "http://www.baidu.com/"
  5. #get的请求
  6. #http请求
  7. #response:http相应的对象
  8. response = urllib.request.urlopen(url)
  9. #
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值