url的详解,常用请求方法,请求头常见参数,常见响应状态码

URL的组成和说明

URL是uniform Resource locator的简写,中文意思是统一资源定位符

在这里插入图片描述

  • scheme: 代表的是访问的协议, 一般为http或者https以及ftp等
  • host:主机名,域名,比如:www.baidu.com
  • port:端口号,当你访问一个网站时,浏览器默认使用80端口
  • path:查找路径,比如:https://mp.csdn.net/mdeditor/103399059,后面的/mdeditor/103399059就是查找路径
  • query-string:查询字符串。比如: www.baidu.com/s?wd=python,后面wd=python就是查询的字符串
  • anchor:锚点,一般都是前端做页面定位的

再浏览器中请求的url,浏览器会对url进行一个编码。除了英文字符,数字和部分符号外,其他全部使用百分号%+十六进制码值进行编码
比如:
复制下来的url路径是这样的:
在这里插入图片描述
粘贴到文本是这样:https://baike.baidu.com/item/%E7%9B%B2%E5%83%A7/6153769?fr=aladdin

说明了浏览器对我们中文字符进行了编码

常用的请求方法

在http协议中,定义了八种请求方法。常用的是get和post

get请求:一般情况下,只从服务器获取数据下来,并不会对服务器资料产生任何影响
post请求:向服务器发送数据(登录)、上传文件等。会对服务器资源产生影响
注:以上是一般情况下会遵循使用原则,但是有的网站和服务器回了做反爬虫机制,不会按照常理出牌。

请求头常见参数

在http协议中,向服务器发送一个请求,数据分为三部分,第一个是把数据放在url中,第二个是把数据放在body中(post请求中),第三个是把数据放在head中。
user-Agent:浏览器名称。请求网页的时候,服务器通过这个参数知道这个请求是由那个浏览器发送的
Referer:表明当前这个请求是从那个url过来的。一般用在反爬虫技术,如果不是从指定页面过来,那么就不做对应的响应
Cookie:http协议是无状态的,也就是同一个人发送了两次请求,服务器没有能力知道这两个请求是否来自同一个人,一次这个时候使用cookie来做标识。一般都如果想要登录后才能访问的网站,那么就需要发送cookie信息了

常见响应状态码

  • 200:请求正常,服务器正常的返回数据
  • 301:永久重定向
  • 302:临时重定向
  • 400:请求的url在服务器上找不到
  • 403:服务器拒绝访问,权限不够
  • 500:服务器内部错误。可能是服务器出现了bug
  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值