网络爬虫抓包
一、简介
1、TCP/IP协议
TCP,英文全称Transmission control protocol,直译为:传输控制协议。是一种面向连接,可靠的,基于字节流的传输层通信协议。它是为了在不可靠的互联网上提供可靠的端到端字节流而专门设计的一个传输协议。
计算机与网络设备要相互通信,双方就必须基于相同的方法。比如,如何探测到通信目标、由哪一边先发起通信,使用哪种语言进行通信、怎样结束通信等规则都事先确定。
TCP/IP是互联网相关的是互联网相关的各类协议簇的总称,比如TCP,UDP,IP,FTP,HTTP,ICMP,SMTP等属于TCP/IP族内的协议。
TCP/IP模型是互联网的基础,它是一些列网络协议的总称,这些协议可以分为四层。
链路层:负责封装和解封装IP报文,发送和接收ARP/RARP报文等。
网络层:负责路由以及把分组报文发送给目标网络或主机
传输层:负责对报文进行分组和重组,并以TCP或UDP协议格式封装报文。
应用层:负责向用户提供应用程序,比如HTTP,FTP,Telnet,DNS,SMTP等。
1、连接过程
第一次握手:
客户端向服务端发送连接请求报文段,该报文段中包含自身的数据通讯初识序号。请求发送后,客户端