HTTP基础

一、HTTP vs HTTPS

HTTPS是SSL加密的安全版HTTP

二、HTTP请求过程

1. 客户端向服务器发出请求

请求方法:GET、POST

GETPOST
请求参数位置包含在URL中,信息可见在表单中(如用户名密码登录)
提交数据大小不超过1024字节无限制,可上传文件

请求网址:URL,唯一确定请求资源

请求头:服务器需要附加信息,包含Accept、Cookies、Referrer等

请求体:一般为POST表单数据

2. 服务器返回响应

响应状态码

状态响应码响应状态

200

正常
404页面未找到
500服务器错误

响应头

响应体 :正文

三、网页结构

HTML:网页结构

CSS:页面美化

JavaScript:动态交互

四、会话和Cookies

1. 无状态HTTP

服务器缺少记录状态,只负责完成请求,后续处理信息需要重传(例如每次都需要登录)。

2. 会话

在服务端,保存用户的会话信息

3. Cookies

客户端,下次访问网页时自动附带Cookies给服务器,区分用户,判断登录状态,返回响应(自动登录)。

五、爬虫Robots协议

规定了哪些页面能爬(Allow),哪些页面不能爬(Disallow)。

爬虫过快或高频率会对服务器产生压力,导致IP被封锁。

  • 9
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值