一直在使用Tomcat,但是知识点点非常零散,没有系统的总结和思考过。知道Tomcat是一个运行Servlet和JSP的轻量级服务器,知道Tomcat可以启动一个Java服务。每次将java工程的war包放到tomcat的webapp目录下,启动服务器就可以访问相应的服务。但是对tomcat的原理的掌握非常零散。
文章目录
1.servlet
key word:servlet、servlet容器、web server
Tomcat是可以运行Servlet和JSP的Web应用服务器。理解Tomcat就必须先理解Servlet。
来源于维基百科的解释:Servlet(Server Applet),全称Java Servlet。是用Java编写的服务器端程序。其主要功能在于交互式地浏览和修改数据,生成动态Web内容。狭义的Servlet是指Java语言实现的一个接口,广义的Servlet是指任何实现了这个Servlet接口的类,一般情况下,人们将Servlet理解为后者。Servlet运行于支持Java的应用服务器中。从实现上讲,Servlet可以响应任何类型的请求,但绝大多数情况下Servlet只用来扩展基于HTTP协议的Web服务器。
它的工作模式的最简洁的描述就是:①客户端发送请求至服务器②服务器启动并调用Servlet,Servlet根据客户端请求生成响应内容并将其传给服务器③服务器将响应返回客户端。
简单来说:servlet就是一个可以实现特定功能的Java接口,且必须运行在支持Servlet的应用服务器上,比如Tomcat。Servlet由Servlet容器所管理,关于Servlet容器可以参考该文章,将servlet、servlet容器、Web Server的关系讲解的比较清晰:servlet是按照特定要求实现了某种服务的接口,所有的servlet由servlet容器来管理,servlet容器是web Server(例如tomcat)中的重要组成部分,实现了服务端可动态返回所需求的内容。一下就是Tomcat服务器响应客户请求过程。
①处表示Web服务器接收到客户端发出的HTTP请求后,转发给Servlet容器,同时把控制返回Servlet容器。②处表示Servlet容器把响应对象ServletResponse中的处理结果返回给Web服务器,通知Web服务器以HTTP响应的方式发送给客户端,同时把控制返回给Web服务器。
2.Tomcat层次结构
2.1 tomcat结构
Tomcat服务器是一系列的可配置组装件构成,核心组件是Catalina Servlet容器。
(1)Server层
对应Server组件,逻辑上表示整个Tomcat,即整个Catalina Servlet容器。它处于Tomcat顶层,可以包含一个或多个Service层。Tomcat提供了该层接口的一个默认实现,所以通常不需要用户自己去实现。
(2)Service层
对应Service组件,是包含在Server层中的一个逻辑功能层。它包含一个Engine层,以及一个或多个连接器(Connector)。Service组件将一个或多个Connector组件绑定到Engine层上,Connector组件侦听端口,获得用户请求,并将请求交给Engine层处理,同时把处理结果发给用户,从而实现一个特定的实际功能。Tomcat提供了Service接口的默认实现,所以通常也不需要用户定制。
(3)Engine层
对应Engine组件,该层是请求分发处理层,可以连接多个Connector。它从Connector接收请求后,解析出可以完成用户请求的URL,根据该URL可以把请求匹配到正确的Host上,当Host处理完用户请求后,Engine层把结果返回给适合的连接器,再由连接器传输给用户。该层的接口一般不需要用户来定制,特殊情况下,用户可以通过实现该接口来提供自定义的引擎。
(4)Host层
对应Host组件,该层表示一个虚拟主机,一个Engine层可以包含多个Host层,每个Host层可以包含一个或多个Context层,对应不同的Web应用。因为Tomcat给出的Host接口的实现(类StandardHost)提供了重要的附加功能,所以用户通常不需要定制Host。
(5)Context层
对应Context组件,该层代表某个虚拟主机上的实际目录或一个WAR,即单个Web应用程序,它运行在特定的虚拟主机中,使用最为频繁。一个Host层包含多个Context层,每一个Context都有唯一的路径,Host层接到请求后,根据用户请求的URL,将请求定位到Context层。
假设有3个Web应用,分别为HelloWorld、Counter和TableList,他们对应的URL分别为:
helloWorld:http://localhost1:8080/HelloWorld/index.html
Counter:http://localhost1:8080/HelloWorld/index.html
TableList:http://localhost1:8080/TableList/index.jsp
3个用户分别访问上述3个地址,则Tomcat服务器各个组件响应用户请求的过程如下图所示,其中每一个Context容器对应位移的Java Web应用。
2.2 Servlet与tomcat的关系
在第1节中讲述了servlet的功能及含义,提到tomcat是servlet容器,那么servlet在tomcat结构中的具体位置在哪里呢?参考一篇讲的很棒的博客。
Tomcat 的容器等级中,Context 容器是直接管理在容器中的包装类 Wrapper (Servlet 被解析和包装成Context 容器中的 StandardWrapper),所以 Context 容器如何运行将直接影响 Servlet 的工作方式。所以,真正管理 Servlet 的容器是 Context 容器,一个 Context 对应一个 Web 工程,而在一个Web工程中可能存在多个Wrapper(包装后的servlet)。
从 Tomcat 的配置文件中可以很容易发现这一点,如下:
<Context path="/projectOne " docBase="D:\projects\projectOne"
reloadable="true" />
3.Tomcat配置
在Tomcat目录中,比较重要的配置文件有\conf下的tomcat-users.xml、server.xml以及\webapps中应用程序目录下的web.xml。
3.1 server.xml
要想顺利使用Tomcat,理解它的工作流程,必须了解server.xml的配置,参考这个博客中对web.xml每个字段的讲解。也可以参考更加详细的那个博客.
<Server port="8005" shutdown="SHUTDOWN"> <--! 表示向8005端口发送SHUTDOWN命令可关闭tomcat-->
<Listener className="org.apache.catalina.core.AprLifecycleListener" SSLEngine="on" />
<Listener className="org.apache.catalina.core.JasperListener" />
<Listener className="org.apache.catalina.core.JreMemoryLeakPreventionListener" />
<Listener className="org.apache.catalina.mbeans.ServerLifecycleListener" />
<Listener className="org.apache.catalina.mbeans.GlobalResourcesLifecycleListener" />
<GlobalNamingResources><Resource /></GlobalNamingResources>
<Service name="Catalina">
<Connector />
<Connector />
<Engine >
<Realm/>
<Host>
<Context ></Context>
</Host>
</Engine>
</Service>
</Server>
注意上面提到的reloadable字段,如果为true。则可以自动检测目录/WEB-INF/lib和目录/WEB-INF/classes下内容变化,自动装载新的应用程序,在不重启tomcat的情况下改变应用程序。
注意上表中的unpackWARs字段,如果为true,则tomcat会自动将WAR文件解压,否则不解压,直接从WAR文件中运行应用程序。
3.2 web.xml
web.xml分为/conf/web.xml文件和项目目录下的webxml。他们的加载顺序是 tomcat conf目录下 —>项目目录下的。tomcat config目录下的为服务器全局作用域,一般用来配置全局设置、数据源等,而项目目录下的为局部作用域。
/conf/web.xml一般是通用的,如果不设置,会有默认的。而项目中的web.xml更加复杂,有很多的常用元素。
<web-app>
<display-name></display-name> 定义了WEB应用的名字
<description></description> 声明WEB应用的描述信息
<context-param></context-param> 声明应用范围内的初始化参数。
<filter></filter> 过滤器元素将一个名字与一个实现javax.servlet.Filter接口的类相关联。
<filter-mapping></filter-mapping> 一旦命名了一个过滤器,就要利用filter-mapping元素把它与一个或多个servlet或JSP页面相关联。
<listener></listener>servlet API的版本2.3增加了对事件监听程序的支持,事件监听程序在建立、修改和删除会话或servlet环境时得到通知。
Listener元素指出事件监听程序类。
<servlet></servlet> 在向servlet或JSP页面制定初始化参数或定制URL时,必须首先命名servlet或JSP页面。Servlet元素就是用来完成此项任务的。
<servlet-mapping></servlet-mapping> 服务器一般为servlet提供一个缺省的URL:http://host/webAppPrefix/servlet/ServletName。
但是,常常会更改这个URL,以便servlet可以访问初始化参数或更容易地处理相对URL。在更改缺省URL时,使用servlet-mapping元素。
<session-config></session-config> 如果某个会话在一定时间内未被访问,服务器可以抛弃它以节省内存。
可通过使用HttpSession的setMaxInactiveInterval方法明确设置单个会话对象的超时值,或者可利用session-config元素制定缺省超时值。
<mime-mapping></mime-mapping>如果Web应用具有想到特殊的文件,希望能保证给他们分配特定的MIME类型,则mime-mapping元素提供这种保证。
<welcome-file-list></welcome-file-list> 指示服务器在收到引用一个目录名而不是文件名的URL时,使用哪个文件。
<error-page></error-page> 在返回特定HTTP状态代码时,或者特定类型的异常被抛出时,能够制定将要显示的页面。
<taglib></taglib> 对标记库描述符文件(Tag Libraryu Descriptor file)指定别名。此功能使你能够更改TLD文件的位置,
而不用编辑使用这些文件的JSP页面。
<resource-env-ref></resource-env-ref>声明与资源相关的一个管理对象。
<resource-ref></resource-ref> 声明一个资源工厂使用的外部资源。
<security-constraint></security-constraint> 制定应该保护的URL。它与login-config元素联合使用
<login-config></login-config> 指定服务器应该怎样给试图访问受保护页面的用户授权。它与sercurity-constraint元素联合使用。
<security-role></security-role>给出安全角色的一个列表,这些角色将出现在servlet元素内的security-role-ref元素
的role-name子元素中。分别地声明角色可使高级IDE处理安全信息更为容易。
<env-entry></env-entry>声明Web应用的环境项。
<ejb-ref></ejb-ref>声明一个EJB的主目录的引用。
< ejb-local-ref></ ejb-local-ref>声明一个EJB的本地主目录的应用。
</web-app>
其中,各个元素配置的含义可以参考这个博客,它讲解了每个元素配置的方法。其中servlet的配置即在tomcat启动时,注册的servlet就会加载到servlet容器当中。具体servlet的配置如下所示,每一个servlet都会匹配一些特定格式的URL。
<servlet></servlet> 用来声明一个servlet的数据,主要有以下子元素:
<servlet-name></servlet-name> 指定servlet的名称
<servlet-class></servlet-class> 指定servlet的类名称
<jsp-file></jsp-file> 指定web站台中的某个JSP网页的完整路径
<init-param></init-param> 用来定义参数,可有多个init-param。在servlet类中通过getInitParamenter(String name)方法访问初始化参数
<load-on-startup></load-on-startup>指定当Web应用启动时,装载Servlet的次序。
当值为正数或零时:Servlet容器先加载数值小的servlet,再依次加载其他数值大的servlet.
当值为负或未定义:Servlet容器将在Web客户首次访问这个servlet时加载它
<servlet-mapping></servlet-mapping> 用来定义servlet所对应的URL,包含两个子元素
<servlet-name></servlet-name> 指定servlet的名称
4. Tomcat的启动流程
4.1 请求处理流程
tomcat请求处理开始于:监听的Socket端口接收到数据,结束于将服务器的处理结果写入到Socket的输出流。下图是简单的过程。
4.2 请求映射
请求映射具体过程分为2个部分:一部分负责根据请求路径匹配的结果,按照回话等信息获取最终的映射结果(因为只根据请求路径匹配,结果可能为多个)。第二部分位于Mapper.map,负责完成具体的请求路径的匹配(下图中黑体部分:调用Mapper.map将匹配的Context、Wrapper设置到请求中)。
映射结果的获取流程如下图所示,其功能主要是通过请求来映射出对应的context。之所以流程看起来这么复杂,主要是因为存在多种情况,需要判断和处理,最终返回的Tomcat满足如下要求:
- 匹配请求路径
- 如果有有效会话,则为包含会话的最新版本
- 如果没有有效会话免责为所有匹配请求的最新版本
- Context必须是有效的(非暂停状态)
参考资料:《Tomcat架构解析》 中国工信出版集团/人民邮电出版社 刘光瑞著