第2章-爬虫请求模块

本文详细介绍了Python的urllib.request和urllib.parse模块,包括urlretrieve()、urlopen()、Request()、urlencode()和quote()等方法的使用。接着讨论了urllib请求方式的GET和POST实例,以及requests模块的get、post方法,代理设置、处理SSL证书和cookie、session的应用。最后提到了知识扩展,探讨了爬取过程中的一些实际问题。
摘要由CSDN通过智能技术生成

一、urllib.request模块

1、urlretrieve()

urllib.request.urlretrieve()网址内容下载

urlretrieve(url, filename=None, reporthook=None, data=None)

在这里插入图片描述

2、urlopen()

urllib.request.urlopen()网页源码下载

urlopen(url, data=None, timeout=socket._GLOBAL_DEFAULT_TIMEOUT,
            *, cafile=None, capath=None, cadefault=False, context=None)

urlopen()即可以传入一个网址,也可传入一个对象

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值