协议: 就是两个计算机之间为了能够流畅的进行沟通而设置的一个君子协议(Robots) 常见的协议有TCP/IP.SOAP协议。HTTP协议 SMTP协议等等。。。。。
HTTP协议是超文本传输协议,简单说就是浏览器和服务器之间的数据交互遵守的协议就是HTTP协议。
HTTP协议把一条消息分三大块
请求:
响应:
请求方式
1 GET:显示提交
2 POST:隐示提交
请求头常见的一些重要信息(爬虫需要)
1 User-Agent:请求载体的身份标识(用什么发送的请求)
2 Rererer:防盗链(这次请求是从哪个页面来的?反爬会用)
3 cookie:本地字符串数据信息(用户登录的信息,反爬的token)
扩展知识
关于token这个需要经验的,用于各种攻击和反爬。