【爬虫入门3】requests库

IP协议负责传输

TCP协议负责可靠性

DNS负责域名解析

HTTP规定应用进程间通信和交互的规则

requests库

爬虫最重要的2个库,一个是获取HTML文件的requests库,一个是从HTML文件中获取想要文件的BeautifulSoup库。

安装requests库:pip install requests

导入requests库:import requests

基本使用

基本GET请求

无参数

运行结果:
http://www.baidu.com/

有参数

运行结果:

http://www.baidu.com/?key1=value1&key2=value2

设置header头

基本POST请求

有数据

有数据(json格式)

上传文件

-----------------------

Cookies

请求超时配置

持久会话

 

代理

使用代理IP访问WEB服务器

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值