python网络爬虫与信息提取系列之Request库入门(四)

# 本文为中国大学慕课笔记,若有不正确的地方,感谢指正! #

主要内容:HTTP协议及Requests库方法

 

一、HTTP协议

1.HTTP定义

HTTP,Hypertext Transfer Protocol,超文本传输协议。是一种基于”请求与响应”模式的、无状态的应用层协议。该协议一般采用URL作为定位网络资源的标识。

  • 请求与响应:用户请求,服务器响应
  • 无状态:第一次请求与第二次请求无关联
  • URL格式:http://host[:port][path]
    • host:合法的Internet主机域名或IP地址
    • port:端口号,可缺省,默认为80
    • path:请求资源的路径

2.HTTP协议对资源的操作

这六个操作实际上就是Requests库的函数所对应的功能。

当我们需要从网页上获取信息时,可以使用GET、HEAD操作:

  • GET:获取网页的全部信息
  • HEAD:获取网页的头部信息

当我们想对URL上的资源进行管理时,可以使用PUT、POST、PATCH、DELETE操作:

  • PUT:把自己的资源放到URL上,可覆盖原信息
  • POST:在URL追加自己的信息
  • PATCH:更新URL局部位置上的资源信息
  • DELETE:删除URL上的资源信息

 

二、Requests库的7个主要方法:

 

三、HTTP协议与Requests库

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值