爬虫学习2——爬虫请求模块

最新推荐文章于 2024-09-09 23:28:21 发布

愿美梦成真

最新推荐文章于 2024-09-09 23:28:21 发布

阅读量95

点赞数

分类专栏： Python爬虫文章标签： python

本文链接：https://blog.csdn.net/weixin_43510391/article/details/113573571

版权

3 篇文章 1 订阅

订阅专栏

1. urllib.request模块

GET特点：查询参数在URL地址中显示
POST
①在Request⽅法中添加data参数
urllib.request.Request(url,data=data,headers=headers)
②data ：表单数据以bytes类型提交,不能是str

使⽤requests添加代理只需要在请求⽅法中(get/post)传递proxies参数就可以了
代理⽹站
① ⻄刺免费代理IP：http://www.xicidaili.com/
② 快代理：http://www.kuaidaili.com/
③ 代理云：http://www.dailiyun.com/

cookie ：通过在客户端记录的信息确定⽤户身份

HTTP是⼀种⽆连接协议,客户端和服务器交互仅仅限于请求/响应过程,结束后断开,下⼀次请求时,服务器会认为是⼀个新的客户端,为了维护他们之间的连接,让服务器知道这是前⼀个⽤户发起的请求,必须在⼀个地⽅保存客户端信息。

session ：通过在服务端记录的信息确定⽤户身份这⾥这个session就是⼀个指的是会话

什么是SSL证书？

SSL证书是数字证书的⼀种，类似于驾驶证、护照和营业执照的电⼦副本。因为配置在服务器上，也称为SSL服务器证书。SSL 证书就是遵守 SSL协议，由受信任的数字证书颁发机构CA，在验证服务器身份后颁发，具有服务器身份验证和数据传输加密功能。

关注

专栏目录