JAVA并发数据结构详解

前言:这是一场艰苦的旅行....

请首先参考:http://shift-alt-ctrl.iteye.com/blog/1839142

一.BlockingDeque阻塞双端队列(线程安全):

注意ArrayDeque和LinkedList仅仅扩展了Deque,是非阻塞类型的双端队列。

BlockingQueue单向队列,其内部基于ReentrantLock + Condition来控制同步和"阻塞"/"唤醒"的时机;有如下几个实现类:

  1. ArrayBlockingQueue: “浮动相对游标”的数组,来实现有界的阻塞队列。
  2. DelayQueue:支持“可延迟”的队列,DelayQueue还只接受Delayed类型的元素,Delayed接口继承自Compare接口并提供了一个long getDelay(TimeUnit),来获取指定时间到now的时间剩余量。DelayQueue底层就是使用PriorityQueue作为支撑的。
  3. PriorityBlockingQueue:有权重的队列,此队列时可以根据指定的comparator进行排序的。
  4. SynchronousQueue://
  5. LinkedBlockingDeque:有界或者无界阻塞队列

PriorityQueue为非线程安全非阻塞,有权重的队列,其权重需要根据特定的compartor来产生。

 

二.ConcurrentMap(接口):支持并发的map,支持多线程环境中安全的访问。

其提供了几个独特的方法:

  • V putIfAbsent(K,V):如果map中不存在此key,则put,否则返回现有的此key关联的值。此过程有Lock同步:

 

//等价于:
if (!map.containsKey(key)) 
      return map.put(key, value);
  else
return map.get(key);
 
Map<String,Object> map = new ConcurrentHashMap<String, Object>();
if(map.containsKey("key")){
    map.put("key", new Object());
}
//注意,concurrentHashMap并不保证contains方法和put方法直接保持"原子性",即有可能contains方法返回false之后,在put之前,可能其他线程已经put成功,即在当前线程put时,此时数据已经不一致了.建议采用putIfAbsent
 

 

  • boolean remove(Object key,Object value):比较并删除指定的key和value。
  • boolean replace(K,V oldValue,V newValue):比较并替换。

目前实现ConcurrentMap的类有ConcurrentHashMap,一种基于锁分段技术(Segement)实现的并发hashMap,锁采取了ReentrantLock(Segement扩展了ReentrantLock)。

备注:

1)HashMap非线程安全,即在并发环境中进行put、remove时,map容器中最终的数据可能并非当前线程预期的结果,比如Thread-1、Thread-2同时对map中相同的key进行put操作,因为并发的问题,可能Thread-1操作之后(尚未返回)值已经被Thread-2给覆盖,即put方法返回的V与map中实际存储的V并不一致;还有另外一个问题,HashMap内部基于数组存储,所以在并发操作时,数据的扩容并不是“同步的”,这仍然会导致一些问题。

2)为了解决HashMap线程安全问题,我们可以手动对hashMap实例进行同步操作,或者使用JAVA中自带的SynchronizedMap,可以通过Collections.synchronizedMap()创建,此map是线程安全的,其内部put/remove方法均是同步的。但是这种同步,尽管保证了数据安全,但是却牺牲了并发性。

3)所以,我们引入了ConcurrentHashMap,既是线程安全的,有可以支持并发操作。

在JDK 1.6中,ConcurrentHashMap基于锁分段手段来提高并发能力,相对于synchronizedMap任何时候只能有一个线程操作(put、remove),ConcurrentHashMap允许多个线程并发操作且可以保证数据操作是安全的;ConcurrentHashMap中有一个“CONCURRENT_LEVEL”(并发级别)的属性,默认为16,即最多允许16个线程并行操作;此外它还有一个Segements[],数组大小跟并发级别一样,对于任何put/remove操作,首先根据key的hashcode对并发级别取模,并将模数作为Segements[]数组的索引,获取segement对象,然后执行lock,并在数据操作完毕后unlock。由此可见,hashcode与并发level模数相同的key,将会被“同步执行”,模数不同的key使用不同的lock,可以并行执行。这个思想非常简单易于理解!

在JDK 1.8中,ConcurrentHashMap的实现原理进行了修正,抛弃了Segements锁的手段和并发级别,转而使用CAS + 同步操作。(具体原理比较复杂,暂不介绍)

 

三.ConcurrentLinkedQueue:

基于单向链表实现的,线程安全的并发队列,无界非阻塞队列,当队列需要在多线程环境中被使用,可以考虑使用它。记住,这是个非阻塞队列不过支持阻塞的队列,貌似都是线程安全的

此队列的size不是时间固定的,它的iterator也会被不断调整。ConcurrentLinkedQueue并没有使用Lock,而是采用了CAS的方式,对tail.next进行赋值操作。因为tail.next永远是null,且队列不接受null的元素。

 

注意,非并发集合(list,queue,set)的iterator以及forEach循环在并发环境中是不能正常工作的,如果原始集合被外部修改(其他线程的add,remove),将会导致异常。对于并发集合的iterator,没有做相关的size校验。

 

Lock(锁)是控制操作(action)的,可以让一个操作或者一个子操作被串行的处理。。。CAS其实只是对内存数据的变更时使用,如果想知道数据变更在并发环境中是否符合预期,才会使用到CAS。

 

四.ConcurrentSkipListMap/ConcurrentSkipListSet

两个基于SkipList(跳跃表)方式实现的、支持并发访问的数据结构。依据跳跃表的思想,可以提高数据访问的效率。其中ConcurrentSkipListSet底层使用ConcurrentSkipListMap支撑。

ConcurrentSkipListMap也是ConcurrentNavigableMap的实现类,对于SkipList,其内部元素,必须是可排序的。

 

跳跃表是一个很简单的表,(参见跳跃表概念),对底层的线性存储结构,加入类似“多级索引”的概念,“索引”的添加时基于随即化。一个跳跃表,整体设计上(设计思路很多)分为表左端head索引,右端tail索引(边界),底端存储层(排序的线性链表),和一个随机化、散列化的不同高度的多级索引“指针”。head索引是高度最高的索引,它是整个链表中值最小的元素锁产生的索引;右端为边界索引,索引指向null或者任意设计的边界值(bound).

 

跳跃表的底端是一个和普通的链表没啥区别,单向或者双向的均可,前提是必须是排序的。索引节点,就是一个有向路径的标,每个索引节点,都分别有right、down指向,对于双向跳跃表,就具有left、right、up、down四个方向指针;指针就是为了方便寻路。每个新增元素时,首先会导致底层链表的改动;根据自定义的随即算法,来决定此元素的索引高度,如果高度不为0,则依次建立相应层高的索引,并调整各个层高的所以指向。

 

跳跃表之所以这么设计,实事上就是在做一件事情:基于简单的设计思路和算法,来实现较为高效的查询策略。相对于二分查找有一定的优势.

 

五.CopyOnWriteArrayList/CopyOnWriteArraySet:

均是CopyOnWrite思想,在数据修改时(happen-before),对数据进行Copy(),read操作可以在原数据结构上继续进行,待write操作结束后,调整数据结构指针。基于这种设计思路的数据结构,通常是read操作频率远大于write操作,可以在并发环境中,支撑较高的吞吐量;避免了因为同步而带来的瓶颈,同时也能确保数据安全操作。同时需要注意,copy操作将会带来多余的空间消耗。注意,此API时支持并发的,多个线程add操作(即CopyOnWrite)将会被队列化,内部采取了ReentrantLock机制来控制.

  • CopyOnWriteArrayList底层基于数组实现,在进行write操作时(add,remove),将会导致Arrays.copy操作,创建一个新的数组;待write操作成功后,将原数组的指针替换成新数组指针.
  • CopyOnWriteArraySet底层直接使用CopyOnWriteArrayList作为支撑,只不过在add操作时会遍历整个数组结构并进行equals比较(确保具有Set的特性),只有发现此新元素不存在时才会"替换指针".

    java中这两个API,支持并发操作时,仍然可以进行遍历而无需额外的同步;即不会抛出ConcurrentModificationException。事实上,迭代器所持有的数组只是一个"创建iterator时底层数组的引用",所以在遍历期间,即使CopyOnWriteArrayList已经新增或者删除了某些元素,仍不会发生冲突,因为iterator持有的是旧数组的引用,而CopyOnWriteArrayList持有的是Copy操作时创建的新数组引用..由此可见,iterator也无法反应实时的数组变化(遍历期间,实际数组的添加、删除),但是原始数组中对象内容发生改变还是可以在迭代器中反应出来。CopyOnWrite的遍历器的remove/add/set操作不被支持,这区别于ArrayList.

    CopyOnWriteArrayList、CopyOnWriteArraySet,底层基于数组实现,采取ReentrantLock来同步add/remove/clear等操作。并采取了snapshot的简单手段:


 

//例如add:

public boolean add(E e) {
	final ReentrantLock lock = this.lock;
	lock.lock();
	try {
	   Object[] elements = getArray();
	   int len = elements.length;
		//数组copy
	   Object[] newElements = Arrays.copyOf(elements, len + 1);
	   newElements[len] = e;
		//修改结束后,指针转换
	   setArray(newElements);
	   return true;
	} finally {
	   lock.unlock();
	}
}
 

 

 

六.CountDownLatch:

同步类,用于多个线程协调工作。共享锁,当锁计数器较少到0时,将释放等待的线程。使用场景是,在完成一组正在其他线程中执行的操作之前,它允许一个或多个线程一直等待。当CountDownLatch的锁计数器为1时,可以作为一种“开关”来使用。计数器无法被重置,如果需要重复计数,可以使用CyclicBarrier。

CountDownLatch内部基于AQS来控制线程访问。这个API很简单,只有2个核心方法:

  • void await():如果计数器不为0,则获取锁失败,加入同步队列;即线程阻塞。
  • void countDown():释放锁,导致计数器递减,如果此时计数器为0,则表示锁释放成功,AQS会帮助“发射”因为await阻塞的线程(组)。
public class CountDownLatchTestMain {

	/**

	* @param args

	*/

	public static void main(String[] args) throws Exception{
		System.out.println("Begin");
		CountDownLatch latch = new CountDownLatch(2);
		for(int i=0;i<4;i++){
			CThread c = new CThread(i,latch);
			c.start();
			//Thread.sleep(500);
		}
		latch.await();
		System.out.println("End");
	}

	static class CThread extends Thread{
		CountDownLatch latch;
		int count;
		CThread(int count,CountDownLatch latch){
			this.count = count;
			this.latch = latch;
		}
		@Override
		public void run(){
			try{
				System.out.println("---"+count);
			}catch(Exception e){
				e.printStackTrace();
			} finally { latch.countDown();}

		}

	}

}

 
 

七.CyclicBarrier:

循环屏障,它允许一组线程互相等待,直到到达某个公共屏障点;线程(组)数量固定,线程之间需要不时的互相等待,CyclicBarrier和CountDownLatch相比,它可以在释放等待线程后被再次“重用”,所以称为循环屏障。它提供了类似“关卡”的功能。对于失败的同步尝试,CyclicBarrier 使用了一种要么全部要么全不 (all-or-none) 的破坏模式:如果因为中断、失败或者超时等原因,导致线程过早地离开了屏障点,那么在该屏障点等待的其他所有线程也将通过 BrokenBarrierException(如果它们几乎同时被中断,则用 InterruptedException)以反常的方式离开。

 

  • CyclicBarrier(int parties):指定参与者个数
  • CyclicBarrier(int parties,Runnable barrierAction):指定一个屏障操作,此操作将会有最后一个进入barrier的线程执行。
  • int await():在所有的线程达到barrier之前,一直等待。此方法可以抛出InterrutedExeception(此线程被中断),可以抛出BrokenBarrierExeception(当其他参与者在wait期间中断,导致屏障完整性被破坏),在方法被await时,如果抛出上述异常,需要做补救的相应操作。此方法返回当前线程到达屏障时的索引。(第一个到达的,为0,最后一个为getParties() - 1);根据返回值的不同可以做一些操作,比如最先/最后达到的做一些前置、后置操作等。await方法其实就是获取锁的过程---信号量减1,初始信号量为parties,如果信号量减少到0时,将会唤醒之前所有await()的线程,并开始新的一轮(next),不需要执行reset,即此时信号量再次恢复到parties,接下来线程可以继续await。
  • boolean isBroken():屏障是否处于损坏状态。
  • void reset():重置屏障为其初始状态;如果此时有线程在await,其线程将会抛出BrokenBarrierExeception。对于reset操作,需要线程的执行方法有相应的配合(比如支持操作轮训等),否则重置会带来一些不必要的麻烦。。。如果你需要重置,尚不如重新建一个CyclicBarrier。

底层基于ReentrantLock实现。线程阻塞基于Condition方式(注意Condition底层也是通过AQS框架实现);大概伪代码:

ReentrantLock lock = new ReentrantLock();
Condition trip = lock.newCondition();
await方法:
if(count!=0){
	trip.await();//AQS:当前线程队列化,LockSupport.park
	count--;
}else{
	trip.signalAll();
}
 

 

//代码实例

public class CyclicBarrierTestMain {

 

	/**

	* @param args

	*/

	public static void main(String[] args) throws Exception{
		CyclicBarrier barrier = new CyclicBarrier(5, new Runnable() {
			@Override
			public void run() {
				System.out.println("Barrier action!!");
			}
			});
		for(int i=0;i<5;i++){
			CThread c = new CThread(barrier);
			c.start();
		}
		Thread.sleep(1000);
	}

	static class CThread extends Thread{
		CyclicBarrier barrier;
		CThread(CyclicBarrier barrier){
			this.barrier = barrier;
		}
		@Override
		public void run(){
			int count = 0;
			while(true){
				try{
					System.out.print("---" + count);
					int index = barrier.await();
					System.out.println("+++" + count);
					count++;
					if(index == barrier.getParties() - 1){
						//barrier.reset();
					}
				}catch(Exception e){
					e.printStackTrace();
					break;
				}
			}
		}
	}
}
 

 八.Exchanger

Exchanger:同步交换器,2个互相匹配(协调的对象),互相交换数据。2个线程需要把相同类型的数据,以互相等待的方式交换。比如线程1将数据A交换给B,此时线程1等待直到线程B将数据交换出去。Exchanger有一个方法,就是exchange(V x):其作用就是等待另一个线程到达交换点,然后将数据传递给线程。

如果没有其他线程到达交换点,处于调度的目的,禁用当前线程,直到某个线程到达或者某个线程中断。

伪代码:

void exchange(V item){
	//如果有线程已经到达
	for(;;){
		Node e = get();
		if(e != null){
			V i = e.getItem();
			CAS(e,i,null);//将等待匹配者移除
			Thread t = e.waiter;
			LockSupport.unpark(t);
			//
			Node ne = new Node(currentThread,ne);
			set();//将当前需要交换的数据加入,当其他线程unpart之后,可以get,并获取数据
			return i;//返回需要交换的数据
		}else{
			Node e = new Now(currentThread,item);
			set(node);
			LockSupport.park(currentThread);
		//重新回到顶层for循环,并获取交换数据
		}
	}
}
 

如下的例子是基于一个简单的Productor和Consumer模式,一个线程负责生产数据,当数据满时,交换给consumer消费;当consumer消费完时,也申请交换。

 

 

import java.util.ArrayDeque;
import java.util.Queue;
import java.util.Random;
import java.util.concurrent.Exchanger;

public class ExchangerTestMain {

	/**

	* @param args

	*/

	public static void main(String[] args) throws Exception{
		Exchanger<Queue<Integer>> exchanger = new Exchanger<Queue<Integer>>();
		CThread c = new CThread(exchanger);
		PThread p = new PThread(exchanger);
		c.start();
		p.start();
		Thread.sleep(2000);
	}

	static class CThread extends Thread{
		Exchanger<Queue<Integer>> exchanger ;
		Queue<Integer> current;
		CThread(Exchanger<Queue<Integer>> exchanger){
			this.exchanger = exchanger;
		}

		@Override
		public void run(){
			if(current == null){
				current = new ArrayDeque<Integer>(10);
			}
			try{
				while(true){
				//productor
				if(current.size() == 0){
					current = exchanger.exchange(current);//交换出去fullList,希望获得EmptyList
				}
					System.out.println("C:" + current.poll());
				}
			}catch(Exception e){
				e.printStackTrace();
				return;
			}
		}
	}

	static class PThread extends Thread{
		Exchanger<Queue<Integer>> exchanger ;
		Queue<Integer> current;
		PThread(Exchanger<Queue<Integer>> exchanger){
			this.exchanger = exchanger;
		}

		@Override
		public void run(){
			Random r = new Random();
			if(current == null){
				current = new ArrayDeque<Integer>(10);
			}
			try{
				while(true){
					//productor
					if(current.size() >= 10){
						current = exchanger.exchange(current);//交换出去fullList,希望获得EmptyList
					}
					Integer i = r.nextInt(20);
					System.out.println("P:" + i);
					current.add(i);
				}
			}catch(Exception e){
				e.printStackTrace();
				return;
			}
		}
	}
}
 

 

九.Semaphore:信号量

我们需要把semaphore真的看成“信号量”,它是可以被“增减”的锁引用,“0”是判断信号“过剩”的界限。

我们通常使用semaphore来控制资源访问并发量。它底层使用“共享”模式锁实现,提供了“公平”“非公平”2中策略。当“信号量”大于0时,允许获取锁;否则将阻塞直到信号量恢复。

将信号量初始化为 1,使得它在使用时最多只有一个可用的许可,从而可用作一个相互排斥的锁。这通常也称为二进制信号量,因为它只能有两种状态:一个可用的许可,或零个可用的许可。按此方式使用时,二进制信号量具有某种属性(与很多 Lock 实现不同),即可以由线程释放“锁”,而不是由所有者(因为信号量没有所有权的概念)。在某些专门的上下文(如死锁恢复)中这会很有用。

  • Semaphore(int permits, boolean fair):指定信号量,指定公平策略。
  • void acquire():获取一个信号,如果信号量<=0,则阻塞;在非公平模式下,允许闯入。
  • void acquire(int permits).

上面2个方法都会抛出InterruptException,即在等待线程被“中断时”,将会抛出异常而返回。底层基于AQS.acquireSharedInterruptibly()

  • void acquireUninterruptibly():获取一个信号,不支持中断,当线程被中断时,此线程将继续等待,当线程确实从此方法返回后,将设置其中断状态。底层基于AQS.acquireShared();
  • void release():释放一个信号,直接导致信号量++。
  • boolean tryAcquire():获取一个信号,如果获取成功,则返回true。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值