Python爬虫笔记（三）Urllib库的使用

最新推荐文章于 2023-12-09 11:36:27 发布

子昊的风筝

最新推荐文章于 2023-12-09 11:36:27 发布

阅读量145

点赞数

分类专栏： PYTHON爬虫学习笔记

本文链接：https://blog.csdn.net/megrez744/article/details/79820214

版权

2 篇文章 0 订阅

订阅专栏

简述

urllib库是Python自带库，作为最基本的请求库，提供了一系列用于操作URL的功能。

urllib.request 向页面发送请求并返回，联系之前的get和post两种请求方式

urlopen 实现对目标网站的访问，使用urllib.request.urlopen

其中data!=None 时，使用post方式，否则get方式。timeout=1，即要求在1秒内取得响应，否则error

urllib.parse 对url进行解析

urlencode 将字典{}编码，转成url可读形式，如百度搜索栏中的空格会在url中显示%20

urllib.error 异常处理

http测试网址：http://httpbin.org

1简单获取百度首页信息，get模式

import urllib.request

response = urllib.request.urlopen('http://www.baidu.com')
print (response.read().decode("UTF-8"))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注