Web服务器:一般指网站服务器,是指驻留于因特网上的某种计算机上的程序(即在网络上运行的local程序),可以向浏览器等Web客户端发送各种类型的数据。
http :超文本传输协议:是一个基于请求与响应模式的,无状态的,应用层的协议
1.支持C/S模式
2.简单快速:客户端向服务器请求服务时,只需传送请求方法和路径。HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度快
3. 灵活:HTTP允许传输任意数据类型的对象,正在传输的类型由Content-Type加以标记
4. 无连接:仅作用在应用层,底层使用的是TCP;每次连接只处理一个请求,服务器处理完客户的请求,并收到客户的应答后,就断开连接:请求->响应->断开
5. 无状态:HTTP协议是无状态协议,无状态是指协议对事物的处理没有记忆能力,即:缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样导致每次连接传送的数据量增大,反之,在服务器不需要先前信息时他的应答就比较快
例如:http://host[":"port][abs_path][?参数]
http: 表示通过HTTP协议来定位网络资源
host;表示合法的Internet主机域名或者IP地址
prot:指定服务的端口号,为空则使用缺省端口80
abs_path:指定资源的URI(统一资源标识符)。
参数(可选):参数的存在决定了所访问的html网页是动态还是静态或者伪静态
链接: 静态、动态、伪静态的URL结构到底哪种更利于SEO
URL:一般由传输协议,域名,端口号,加具体的资源路径组成
若没有具体的资源路径,则在其尾部自动添加 \ 如:
http://www.sina.com.cn 浏览器会自动添加 \
http://www.sina.com.cn/
在我看来这个\ 就是目标主机的根目录,根目录后面跟的具体路径名就是资源的具体路径
从域名后的第一个“/”开始到最后一个“/”为止,是虚拟目录部分。虚拟目录也不是一个URL必须的部分。
HTTP之响应和
HTTP之请求
:
HTTP消息由客户端到服务器的请求和服务器到客户端的响应组成。请求消息和响应消息都是由开始行(对于请求消息,开始行就是请求行,对于响应消息,开始行就是状态行),消息报头(可选),空行(只有CRLF的行),消息正文(可选)组成。
空行坚决不能少
注:此处的http服务器基于1.0版本的http协议,所以只有GET和POST方法
POST和GET方法区别:
链接: HTTP 的GET和POST区别
请求参数的位置不同:Get的参数在URL上,而Post的参数在请求报文主体
传输数据长度限制:特定浏览器和服务器对URL的长度有限制,因此对于GET提交时,传输数据就会受到URL长度的限制。 POST:由于不是通过URL传值,理论上数据不受限。但实际各个WEB服务器会规定对post提交数据大小进行限制,Apache、IIS6都有各自的配置
安全性:post要比Get高,但也是在某一情况下的相对而言
POST和GET使用选择:
HTTP中的GET,POST,PUT,DELETE就对应着对这个资源的查,改,增,删4个操作。到这里,大家应该有个大概的了解了,GET一般用于获取/查询资源信息,而POST一般用于更新资源信息。
HTTP标准包含这两种方法是为了达到不同的目的。POST用于创建和更新资源,资源的内容会被编入HTTP请示的内容中。例如,处理订货表单、在数据库中加入新数据行等。
当请求无副作用时(如进行搜索),便可使用GET方法;当请求有副作用时(如在数据库添加数据行),则用POST方法。一个比较实际的问题是:GET方法可能会产生很长的URL,或许会超过某些浏览器与服务器对URL长度的限制。
CGI(通用网关接口):
解释:
CGI是外部应用程序(CGI程序)与WEB服务器之间的接口标准,是在CGI程序和Web服务器之间传递信息的过程。CGI规范允许Web服务器执行外部程序,并将它们的输出发送给Web浏览器,CGI将Web的一组简单的静态超媒体文档变成一个完整的新的交互式媒体。
对一个 CGI 程序,做的工作其实只有:从环境变量(environment variables)和标准输入(standard input)中读取数据、处理数据、向标准输出(standard output)输出数据。
环境变量中存储的叫 Request Meta-Variables,也就是诸如 QUERY_STRING、PATH_INFO 之类的东西,这些是由 Web Server 通过环境变量传递给 CGI 程序的,CGI 程序也是从环境变量中读取的。
标准输入中存放的往往是用户通过 PUTS 或者 POST 提交的数据,这些数据也是由 Web Server 传过来的。
只要是提供HTML的服务器端程序都可以叫CGI,APS、PHP、JSP这些都是,你用C语言写一个可以提供HTML的服务器端EXE文件,也叫CGI,换句话说:CGI支持任何语言的编写
简而言之:CGI就是服务器的子进程执行web浏览器需要的功能
注: cgi规定只能以标准输入输出作为数据的导入导出
长连接,短连接:
长连接: Client方与Server方先建立通讯连接,连接建立后不断开, 然后再进行报文发送和接收。
短连接: Client方与Server每进行一次报文收发交易时才进行通讯连接,交易完毕后立即断开连接。此种方式常用于一点对多点
通讯,比如多个Client连接一个Server.
即:请求->响应->断开
数据粘包:
----对于基于TCP开发的通讯程序,有个很重要的问题需要解决,就是封包和拆包.
TCP粘包是指发送方发送的n个数据包,不考虑丢失的情况,在接收方看来只接收了小于n个包的数据包
(*注:无法区分是因为数据在网络上传输的方式是以二进制进行传输)
粘包出现的原因:
发送端等缓冲区满的时候发送数据,造成粘包
接收端不能及时接收缓冲区的包,造成一次性多个包的接收
解决粘包的方法:
一 是对于发送方引起的粘包现象,用户可通过编程设置来避免,TCP提供了强制数据立即传送的操作指令 push,TCP软件收到该操作指令后,就立即将本段数据发送出去,而不必等待发送缓冲区满;
二 是对于接收方引起的粘包,则可通过优化程序设计、精简接收 进程工作量、提高接收进程优先级等措施,使其及时接收数据,从而尽量避免出现粘包现象;
三是由接收方控制,将一包数据按结构字段,人为控制分多次接收,然 后合并,通过这种手段来避免粘包。
以上提到的三种措施,都有其不足之处。第一种编程设置方法虽然可以避免发送方引起的粘包,但它关闭了优化算法,降低了网络发送效率,影响应用程序的 性能,一般不建议使用。第二种方法只能减少出现粘包的可能性,但并不能完全避免粘包,当发送频率较高时,或由于网络突发可能使某个时间段数据包到达接收方 较快,接收方还是有可能来不及接收,从而导致粘包。第三种方法虽然避免了粘包,但应用程序的效率较低,对实时应用的场合不适合.