书籍《Tomcat内核设计剖析》《how tomcat works?》
1. 基础知识
Java的网络通信底层是基于套接字的,其理论依据是应用层与TCP/IP协议族通信的中间抽象层,它是一组接口。
应用层通过调用这些接口发送和接收数据。一般这种抽象层由操作系统提供或者由JVM自己实现。使用套接字通信可以简单地实现应用程序在网络上的通信。一台机器上的应用向套接字中写入信息,另外一台相连的机器能读取到。TCP/IP协议族中有两种套接字类型,分别是流套接字和数据报套接字,分别对应TCP协议和UDP协议。一个TCP/IP套接字由一个互联网地址、一个协议及一个端口号唯一确定。即Socket。
感兴趣的可以去了解下Java的Socket编程,以及它对应的延申出来的一些性能优化模型。
下面是个简单的例子:
Socket socket = new Socket("127.0.0.1", "8080"); //建立连接
OutputStream os = socket.getOutputStream(); //获取输出流
boolean autoflush = true;
PrintWriter out = new PrintWriter( socket.getOutputStream(), autoflush); //设置自动 flush
BufferedReader in = new BufferedReader( new InputStreamReader( socket.getInputstream() ));
-
单线程阻塞I/O模型
-
多线程阻塞I/O模型
-
单线程非阻塞I/O模型
在调用读取或写入接口后立即返回,而不会进入阻塞状态。 -
多线程非阻塞I/O模型
即经典的Reactor模型。(Netty)
–图片来自《Tomcat内核设计剖析》
2. 环境搭建
- 下载源码:地址
- 进入解压目录,并创建一个目录,命名为home , 并将conf、webapps目录移入 home 目录中。
- 在当前目录下创建一个 pom.xml 文件,引入tomcat的依赖包
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>org.apache.tomcat</groupId>
<artifactId>apache-tomcat-8.5.42-src</artifactId>
<name>Tomcat8.5</name>
<version>8.5</version>
<build>
<finalName>Tomcat8.5</finalName>
<sourceDirectory>java</sourceDirectory>
<!-- <testSourceDirectory>test</testSourceDirectory>-->
<resources>
<resource>
<directory>java</directory>
</resource>
</resources>
<!--
<testResources>
<testResource>
<directory>test</directory>
</testResource>
</testResources>
-->
<plugins>
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-compiler-plugin</artifactId>
<version>2.3</version>
<configuration>
<encoding>UTF-8</encoding>
<source>1.8</source>
<target>1.8</target>
</configuration>
</plugin>
</plugins>
</build>
<dependencies>
<dependency>
<groupId>junit</groupId>
<artifactId>junit</artifactId>
<version>4.12</version>
<scope>test</scope>
</dependency>
<dependency>
<groupId>org.easymock</groupId>
<artifactId>easymock</artifactId>
<version>3.4</version>
</dependency>
<dependency>
<groupId>ant</groupId>
<artifactId>ant</artifactId>
<version>1.7.0</version>
</dependency>
<dependency>
<groupId>wsdl4j</groupId>
<artifactId>wsdl4j</artifactId>
<version>1.6.2</version>
</dependency>
<dependency>
<groupId>javax.xml</groupId>
<artifactId>jaxrpc</artifactId>
<version>1.1</version>
</dependency>
<dependency>
<groupId>org.eclipse.jdt.core.compiler</groupId>
<artifactId>ecj</artifactId>
<version>4.5.1</version>
</dependency>
</dependencies>
<!--vmoptions-->
<!-- -Dcatalina.home=D:/apache-tomcat/apache-tomcat-8.5.51-src/home -Dcatalina.base=D:/apache-tomcat/apache-tomcat-8.5.51-src/home -Djava.util.logging.manager=org.apache.juli.ClassLoaderLogManager -Djava.util.logging.config.file=D:/apache-tomcat/apache-tomcat-8.5.51-src/home/conf/logging.properties-->
</project>
-
在idea中, 使用MAVEN导入该工程。
-
配置idea的启动类, 配置 MainClass , 并配置 VM 参数。
找到启动类:
org.apache.catalina.startup.Bootstrap
注意需要和自己的源码文件夹位置对应:
-Dcatalina.home=D:/apache-tomcat/apache-tomcat-8.5.51-src/home -Dcatalina.base=D:/apache-tomcat/apache-tomcat-8.5.51-src/home -Djava.util.logging.manager=org.apache.juli.ClassLoaderLogManager -Djava.util.logging.config.file=D:/apache-tomcat/apache-tomcat-8.5.51-src/home/conf/logging.properties
- 修改一行代码,启动主方法, 运行Tomcat , 访问Tomcat 。
这样做的目的是手动将JSP解析器初始化。
在org.apache.catalina.startup.ContextConfig#configureStart方法下,722行添加如下代码:
context.addServletContainerInitializer(new JasperInitializer(), null);
启动,成功访问。
如果按照上面的流程来出了问题,建议多试试,实在不行看看其他博客。
3. Servlet规范
首先我们得知道:Java体系的Web服务器基本上都会遵循Servlet规范。
其次就是我们需要学习的Servlet以及其具体实现Tomcat(容器)。
从包名就可以看出这是jdk自身定义的规范。
Tomcat作为一款Web服务器,其最基本的通信协议是HTTP(过程如下):
1) 用户通过浏览器进行了一个操作,比如输入网址并回车,或者是点击链接,接着浏览 器获取了这个事件。
2) 浏览器向服务端发出TCP连接请求。
3) 服务程序接受浏览器的连接请求,并经过TCP三次握手建立连接。
4) 浏览器将请求数据打包成一个HTTP协议格式的数据包。
5) 浏览器将该数据包推入网络,数据包经过网络传输,最终达到端服务程序。
6) 服务端程序拿到这个数据包后,同样以HTTP协议格式解包,获取到客户端的意图。
7) 得知客户端意图后进行处理,比如提供静态文件或者调用服务端程序获得动态结果。
8) 服务器将响应结果(可能是HTML或者图片等)按照HTTP协议格式打包。
9) 服务器将响应数据包推入网络,数据包经过网络传输最终达到到浏览器。
10) 浏览器拿到数据包后,以HTTP协议的格式解包,然后解析数据,假设这里的数据是 HTML。
11) 浏览器将HTML文件展示在页面上。
那我们想要探究的Tomcat作为一个HTTP服务器,在这个过程中都做了些什么事情呢?主要是接受连接、解析请求数据、处理请求和发送响应这几个步骤。此外我们还得了解一下Tomcat启动。