Cookies内涵、请求网页过程、GET和POST请求

  1. 这是因为123 06 的CA 证书是中国铁道部自行签发的,而这个证书是不被CA 机构信任的,所以这里证书验证就不会通过而提示这样的话,但是实际上它的数据传输依然是经过SSL 加密的。如果要爬取这样的站点,就需要设置忽略证书的选项,否则会提示SSL 链接错误
  2. 我们在浏览器中输入一个U RL ,回车之后便会在浏览器中观察到页面内容。实际上,这个过程是浏览器向网站所在的服务器发送了一个请求,网站服务器接收到这个请求后进行处理和解析,然后返回对应的响应,接着传回给浏览器。响应里包含了页面的源代码等内容,浏览器再对其进行解析,便将网页呈现了出来,
  3. 网站的服务器返回给我们浏览器的是超文本,即HTML源代码。我们的浏览器把它解析为我们看到的画面。
  4. 常见的请求方法有两种: GET 和POST
    在浏览器中直接输入URL 井回车,这便发起了一个GET 请求,请求的参数会直接包含到URL里。

例如,在百度中搜索Python ,这就是一个GET 请求,链接为htψs://www. baidu.corn/s?wd= Python ,其中URL 中包含了请求的参数信息,这里参数wd 表示要搜寻的关键字。

POST 请求大多在表单提交时发起。
比如,对于一个登录表单,输入用户名和密码后,点击“ 登录”按钮,这通常会发起一个POST请求,其数据通常以表单的形式传输,而不会体现在URL 中。

GET POST请求方法有如下区别。1:GET 请求中的参数包含在URL 里面,数据可以在URL 中看到,而POST 请求的URL 不会包含这些数据,数据都是通过表单形式传输的,会包含在请求体中。2:GET 请求提交的数据最多只有1024 字节(1KB),而POST 方式没有限制

  1. Cookie :
    也常用复数形式Cookies ,这是网站为了辨别用户进行会话跟踪而存储在用户本地的数据。它的主要功能是维持当前访问会话。例如,我们输入用户名和密码成功登录某个网站后,服务器会用会话保存登录状态信息,后面我们每次刷新或请求该站点的其他页面时,会发现都是登录状态,这就是Cookies 的功劳。Cookies 里有信息标识了我们所对应的服务器的会话,每次浏览器在请求该站点的页面时,都会在请求头中加上Cookies 并将其发送给服务器,服务器通过Cookies 识别出是我们自己,并且查出当前状态是登录状态,所以返回结果就是登录之后才能看到的网页内容。

我是热爱编程与零食的小云同学,有问题可以一起交流哦~~~~

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值