爬虫基础Web请求过程、HTTP协议

目录

1. Web请求过程

1.1 需要熟练使用抓包工具

2.什么是协议

3.HTTP协议

3.1 请求

3.2 响应

3.2.1 请求头中一些重要的内容(爬虫需要)

3.2.2 响应头中一些重要的内容


1. Web请求过程

1.服务器渲染:在服务器那边直接把数据和html整合在一起,统一返回给浏览器

特点:在页面源代码中能看到数据  

2.客户端渲染: 第一次请求只要一个html骨架,第二次请求拿到数据,进行数据展示

特点:在页面源代码中,看不到数据

1.1 需要熟练使用抓包工具

示例:谷歌浏览器、微软edge

随便找一个网页进去

 F12 或者 右键点击检查

打开Network    也就是网络工作状态 

2.什么是协议

协议就是两个计算机之间为了能够流畅的进行沟通而设置的一个君子协定,常见的协议有TCP/IP.SOAP协议,HTTP协议,SMTP协议等等....

3.HTTP协议

HTTP协议,Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW.World Wide Web) 服务器传输到超文本到本地浏览器的传送协议,

简单来说:就是浏览器和服务器之间的数据交互遵守的就是HTTP协议

HTTP协议把一条消息分为三大块内容,无论是请求还是响应,都是三块内容

3.1 请求

1.请求行:请求方式(get/post)请求url地址 协议

GET:显示提交

POST:隐示提交

2.请求头:放一些服务器要使用的附加信息

3.请求体:一般放一些请求的参数

3.2 响应

1.状态行:协议 状态码

2.响应头:放一些客户端要使用的一些附加信息

3.响应体:服务器返回的真正客服端要用的内容(HTML,JSON)等

3.2.1 请求头中一些重要的内容(爬虫需要)

1.User-Agent:请求载体的身份标识(用什么发送的要求)

2.Referer:防盗链(这次请求是从哪个页面来的?反爬会用到)

3.cookie:本地字符串数据信息(用户登录信息,反爬的token)

3.2.2 响应头中一些重要的内容

1.cookie:本地字符串数据信息(用户登录信息,反爬的token)

2.各种莫名的字符串(根据经验,一般都是token字样,防止各种攻击和反爬)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值