一,servlet容器如何同时处理多个请求。
Servlet采用多线程来处理多个请求同时访问,Servelet容器维护了一个线程池来服务请求。
线程池实际上是等待执行代码的一组线程叫做工作者线程(Worker Thread),Servlet容器使用一个调度线程来管理工作者线程(Dispatcher Thread)。
当容器收到一个访问Servlet的请求,调度者线程从线程池中选出一个工作者线程,将请求传递给该线程,然后由该线程来执行Servlet的service方法。
当这个线程正在执行的时候,容器收到另外一个请求,调度者线程将从池中选出另外一个工作者线程来服务新的请求,容器并不关系这个请求是否访问的是同一个Servlet还是另外一个Servlet。
当容器同时收到对同一Servlet的多个请求,那这个Servlet的service方法将在多线程中并发的执行。
二,Servlet容器默认采用单实例多线程的方式来处理请求,这样减少产生Servlet实例的开销,提升了对请求的响应时间。对于Tomcat可以在server.xml中通过<Connector>元素设置线程池中线程的数目。
就实现来说:
调度者线程类所担负的责任如其名字,该类的责任是调度线程,只需要利用自己的属性完成自己的责任。所以该类是承担了责任的,并且该类的责任又集中到唯一的单体对象中。
而其他对象又依赖于该特定对象所承担的责任,我们就需要得到该特定对象。那该类就是一个单例模式的实现了。
三,如何开发线程安全的Servlet
1,变量的线程安全:这里的变量指字段和共享数据(如表单参数值)。
a,将 参数变量 本地化。多线程并不共享局部变量.所以我们要尽可能的在servlet中使用局部变量。
例如:String user = "";
user = request.getParameter("user");
b,使用同步块Synchronized,防止可能异步调用的代码块。这意味着线程需要排队处理。
在使用同板块的时候要尽可能的缩小同步代码的范围,不要直接在sevice方法和响应方法上使用同步,这样会严重影响性能。
2,属性的线程安全:ServletContext,HttpSession,ServletRequest对象中属性
ServletContext:(线程是不安全的)
ServletContext是可以多线程同时读/写属性的,线程是不安全的。要对属性的读写进行同步处理或者进行深度Clone()。
所以在Servlet上下文中尽可能少量保存会被修改(写)的数据,可以采取其他方式在多个Servlet中共享,比方我们可以使用单例模式来处理共享数据。
HttpSession:(线程是不安全的)
HttpSession对象在用户会话期间存在,只能在处理属于同一个Session的请求的线程中被访问,因此Session对象的属性访问理论上是线程安全的。
当用户打开多个同属于一个进程的浏览器窗口,在这些窗口的访问属于同一个Session,会出现多次请求,需要多个工作线程来处理请求,可能造成同时多线程读写属性。
这时我们需要对属性的读写进行同步处理:使用同步块Synchronized和使用读/写器来解决。
ServletRequest:(线程是安全的)
对于每一个请求,由一个工作线程来执行,都会创建有一个新的ServletRequest对象,所以ServletRequest对象只能在一个线程中被访问。ServletRequest是线程安全的。
注意:ServletRequest对象在service方法的范围内是有效的,不要试图在service方法结束后仍然保存请求对象的引用。
3,使用同步的集合类:
使用Vector代替ArrayList,使用Hashtable代替HashMap。
4,不要在Servlet中创建自己的线程来完成某个功能。
Servlet本身就是多线程的,在Servlet中再创建线程,将导致执行情况复杂化,出现多线程安全问题。
5,在多个servlet中对外部对象(比方文件)进行修改操作一定要加锁,做到互斥的访问。
四,SingleThreadModel接口
javax.servlet.SingleThreadModel接口是一个标识接口,如果一个Servlet实现了这个接口,那Servlet容器将保证在一个时刻仅有一个线程可以在给定的servlet实例的service方法中执行。将其他所有请求进行排队。
服务器可以使用多个实例来处理请求,代替单个实例的请求排队带来的效益问题。服务器创建一个Servlet类的多个Servlet实例组成的实例池,对于每个请求分配Servlet实例进行响应处理,之后放回到实例池中等待下此请求。这样就造成并发访问的问题。
此时,局部变量(字段)也是安全的,但对于全局变量和共享数据是不安全的,需要进行同步处理。而对于这样多实例的情况SingleThreadModel接口并不能解决并发访问问题。
SingleThreadModel接口在servlet规范中已经被废弃了。
这个问题网上一直没有搜到很详细的解释,也可能是高人的解释不符合我的理解方式。所以自己到网上搜集了写资料再加自己的想法,随便写了点东西发到论坛上,希望大家给予修正意见,看我是否理解对了。
一般servlet在jvm中只有个对象,当多个请求来请求一个jsp页面的时候,实际上都是调用这个jsp编译好的servlet类doPost或者doGet方法。
现在我就模拟一个servlet的调用过程
- new Runnalbe{
- public run(){
- Request requset = new Request();
- Resposne response = new Response();
- //servlet对象只有一个,是容器自动生成的,这里模拟一个servlet的调用过程。
- servlet.doPost (request,response);
- }
- }
当有多个请求过来的时候,相当于多个线程来执行这段代码。上面那个servlet的实现类HelloServlet:
- public class HelloServlet extends HttpServlet {
- private int j =0;
- public void doPost(HttpServletRequest request, HttpServletResponse response){
- int i=0;
- i++;
- j++;
- //这里的i和j那个是线程安全的那个不是呢,后面我们将从线程的堆栈,和jvm的堆的概念来解释这个问题
- //request 和 response 对象是不是线程安全的
- }
- }
JVM是基于堆栈的虚拟机.JVM为每个新创建的线程都分配一个堆栈(这里的堆栈不是指堆).也就是说,对于一个Java程序来说,它的运行
就是通过对堆栈的操作来完成的。堆栈以帧为单位保存线程的状态。JVM对堆栈只进行两种操作:以帧为单位的压栈和出栈操作。
我们知道,某个线程正在执行的方法称为此线程的当前方法.我们可能不知道,当前方法使用的帧称为当前帧。当线程激活一个
Java方法,JVM就会在线程的Java堆栈里新压入一个帧。这个帧自然成为了当前帧.在此方法执行期间,这个帧将用来保存参数,局部变量,中间计算过程和其他数据.这个帧在这里和编译原理中的活动纪录的概念是差不多的。
这里还要补充一下堆的概念:
堆(heap)是放实例和数组的,JAVA里面没有全局变量这个概念,所有变量都是以类的属性或者参数等形式存在的。GC是自动回收.但是数组和类的引用是放在堆栈中。
学过汇编的可能都知道,数据是是存储在栈内的,执行的代码逻辑是可以共用的。当多个线程来访问同一个方法的时候,共享同一段代码逻辑,但是方法对应的数据是存储在各自的堆栈(stack)中,如局部变量和参数还有对象的引用(局部变量和参数也可能是对象的引用)。所以多线程并发的情况下,出现不同步的现象主要是因为各自堆栈存放的某些数据是共享的,说白了就是同一个数据的引用(不是copy)被存放在不同的堆栈中。 例如类X的对象A被多个线程访问,他的引用被保存在多个线程的堆栈中,当多个线程访问A对象的某个属性b的时候如果不加锁就会出现不同步的现象。所以为了避免这种情况发生一是加锁,二就是为每个线程都生成一个类X的对象,这样每个线程的堆栈中存放的类X引用所对应的堆中的对象都不一样,当然就不存在共享的问题。
现在我们回到开始那个例子,可以很好的分析出参数request,respone,i是线程安全的,而j是线程不安全的;
为什么?request,respone是线程安全的是因为每个线程对应的request,respone对象都是不一样的,不存在共享问题。i是线程安全的是应为i是局部变量,每个线程的堆栈中存放的值也是各自独立的。
j线程不安全是应为它是类HelloServlet的属性,找了很多资料都不能说清楚它到底放在那里,从实际效果来看,它是不安全的,所以应该是放在和类对象一起放在堆里面的,堆里面估计是复制了一份过来,因为HelloServlet对多个线程而言只有
一个实例,所以存在共享问题。
====================================================================================
在探讨java线程安全前,让我们先简要介绍一下Java语言。
任何语言,如C++,C#,Java,它们都有相通之处,特别是语法,但如果有人问你,Java语言的核心是什么?类库?关键字?语法?似乎都不 是。Java语言的核心,也就是Sun始终不愿意开源的东西:Java虚拟机的实现(不过sun公开了其Java虚拟机规范),也就有了BEA的 JRockit,IBM的Jikes,Sun的Hotspot。
Java的核心有两点,Java类加载(Java Class Loader)和Java内存管理,它们具体体现在Java类库的以下几个类:
java.lang.ClassLoader(java.lang.Class):我们调用的类,包括其接口和超类,import的类是怎么被Java虚拟机载入的?为什么static的字段在servlet容器里面可以一直生存下去(Spring容器中)?
java.lang.Thread(java.lang.ThreadLocal):垃圾回收是怎么进行的(垃圾回收线程)?我们的程序是怎么退出的?
java.lang.refelect.Proxy(java.lang.refelect.Method):为什么Tomcat、 Tapestry、Webwork、Spring等容器和框架可以通过配置文件来调用我们写的类?Servlet规范、JSF规范、EJB规范、JDBC 规范究竟是怎么回事?为什么它们几乎都是一些接口,而不是具体类?
Servlet线程安全
在Java的server side开发过程中,线程安全(Thread Safe)是一个尤为突出的问题。因为容器,如Servlet、EJB等一般都是多线程运行的。虽然在开发过程中,我们一般不考虑这些问题,但诊断问题 (Robust),程序优化(Performance),我们必须深入它们。
什么是线程安全?
在Java里,线程安全一般体现在两个方面:
1、多个thread对同一个java实例的访问(read和modify)不会相互干扰,它主要体现在关键字synchronized。如 ArrayList和Vector,HashMap和Hashtable(后者每个方法前都有synchronized关键字)。如果你在 interator一个List对象时,其它线程remove一个element,问题就出现了。
2、每个线程都有自己的字段,而不会在多个线程之间共享。它主要体现在java.lang.ThreadLocal类,而没有Java关键字支持,如像static、transient那样。
一个普遍的疑问,我们的Servlet中能够像JavaBean那样declare instance或static字段吗?如果不可以?会引发什么问题?
答案是:不可以。我们下面以实例讲解:
首先,我们写一个普通的Servlet,里面有instance字段count:
web.xml >>
1 <servlet> 2 <servlet-name>SimpleServlet</servlet-name> 3 <servlet-class>servlet.SimpleServlet</servlet-class> 4 </servlet> 5 <servlet-mapping> 6 <servlet-name>SimpleServlet</servlet-name> 7 <url-pattern>/SimpleServlet</url-pattern> 8 </servlet-mapping>
SimpleServlet >>
1 public class SimpleServlet extends HttpServlet { 2 private int counter = 0; 3 @Override 4 protected void service(HttpServletRequest request, HttpServletResponse response) 5 throws ServletException, IOException { 6 response.getWriter().println("<HTML><BODY>"); 7 response.getWriter().println(this + " ==> "); 8 response.getWriter().println(Thread.currentThread() + ": <br>"); 9 for(int c=0;c<10;c++){ 10 response.getWriter().println("Counter = " + counter + "<BR>"); 11 try { 12 Thread.sleep(1000); 13 counter++; 14 } catch (Exception e) { 15 e.printStackTrace(); 16 } 17 } 18 response.getWriter().println("</BODY></HTML>"); 19 } 20 }
test.html >>
1 <HTML> 2 <BODY> 3 <TABLE> 4 <TR> 5 <TD><IFRAME src="SimpleServlet" name="servlet1" height="200%"> </IFRAME></TD> 6 </TR> 7 </TABLE> 8 </BODY> 9 </HTML>
大家应该发现,test.html写的和zwchen的博客原文中的写的有点区别,本来也是按照zwchen的博客原文中的去测试的,但是相信很多人并没有得出理想的结果,正如博客下面评论上5楼所说的:“没有出现线程安全问题,数字的顺序都是正确的”,我也是如此(我用的是Firefox浏览器)。后来换了IE浏览器进行测试出现下面的问题,在页面上只显示出了第一个<tr></tr>里面的内容,于是我的处理方法就是:test.html的内容如上所示,打开3个IE浏览器,同时在浏览器中输入:
a: http://localhost:8080/ServletTest/SimpleServlet
b: http://localhost:8080/ServletTest/SimpleServlet
c: http://localhost:8080/ServletTest/SimpleServlet
测试结果如下:
我们会发现三点:
1、Servlet是一个单例对象(Singleton),因为我们看到多次请求的this指针所有打印出来的hashCode值都相同。
2、servlet在不同的线程(线程池)中运行,如http-8080-1,http-8080-2,http-8080-3 等输出值可以明显区分出不同的线程执行了不同一段Servlet逻辑代码。
3、count变量在不同的线程中共享,而且它的值被不同的线程修改,输出时已经不是顺序输出。也就是说,其他的线程会篡改当前线程中实例变量的值,针对这些对象的访问不是线程安全的。
上面的结果,违反了线程安全的两个方面。
那么,我们怎样保证按照我们期望的结果运行呢?首先,我想保证产生的count都是顺序执行的。
我们将Servlet代码重构如下:
1 public class SimpleServlet extends HttpServlet { 2 private int counter = 0; 3 private String mutex = ""; 4 @Override 5 protected void service(HttpServletRequest request, HttpServletResponse response) 6 throws ServletException, IOException { 7 response.getWriter().println("<HTML><BODY>"); 8 response.getWriter().println(this + " ==> "); 9 response.getWriter().println(Thread.currentThread() + ": <br>"); 10 synchronized (mutex){ 11 for(int c=0;c<10;c++){ 12 response.getWriter().println("Counter = " + counter + "<BR>"); 13 try { 14 Thread.sleep(1000); 15 counter++; 16 } catch (Exception e) { 17 e.printStackTrace(); 18 } 19 } 20 } 21 response.getWriter().println("</BODY></HTML>"); 22 } 23 }
这符合了我们的要求,输出都是按顺序的,这正式synchronized的含义。
附带说一下,我现在synchronized的是一个字符串变量mutex,不是this对象,这主要是从performance和 Scalability考虑。Synchronized用在this对象上,会带来严重的可伸缩性的问题(Scalability),所有的并发请求都要排队!