并发:多个线程操作相同的资源,保证线程安全,合理使用资源。
高并发:高并发(High Concurrency)是互联网分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计保证系统能同时并行处理很多请求。
并发最简单的场景举例(实现一个计数功能):
import com.mmall.concurrency.annoations.NotThreadSafe;
import lombok.extern.slf4j.Slf4j;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.Semaphore;
@Slf4j
@NotThreadSafe
public class CountExample {
// 请求总数
public static int clientTotal = 5000;
// 同时并发执行的线程数
public static int threadTotal = 200;
public static int count = 0;
public static void main(String[] args) throws Exception {
ExecutorService executorService = Executors.newCachedThreadPool();
final Semaphore semaphore = new Semaphore(threadTotal);
for (int i = 0; i < clientTotal ; i++) {
executorService.execute(() -> {
try {
semaphore.acquire();
//执行add()操作,对count进行+1
add();
semaphore.release();
} catch (Exception e) {
log.error("exception", e);
}
});
}
executorService.shutdown();
log.info("count:{}", count);
}
private static void add() {
count++;
}
}
多次执行这段代码,每次的结果都不一样:
4995
4993
4990
4999
4999
....
将同时并发执行的线程数改为1:
public static int threadTotal = 1;
再重新多次执行程序:
5000
5000
5000
5000
5000
每次的结果都为预期的5000。
两次结果之所以不一致,时因为并发环境下不经过处理无法保证结果正确。
2 CPU多级缓存:
使用CPU cache的原因:CPU的频率太快了,快到主存跟不上,这样一来在处理器时钟周期内,CPU常常需要等待缓存,浪费CPU资源。所以cache的出现,是为了缓解CPU和内存之间速度的不匹配问题(结构:cpu->cache->memory)。
2.1缓存一致性(MESI):
用于保证多个CPU cache之间缓存共享数据的一致。
缓存中数据的四种状态:
M:被修改,代表该数据只被缓存在该CPU的缓存中,并且已被修改过,与主存中的数据不一致,因此,该状态的数据需要在未来的某个时间点写回主存,写回主存后该数据的状态会变为E。
E:独享状态,该数据同样只被缓存在该CPU的缓存中,但未被修改过,与主存中的数据一致。当该状态的数据被修改过但还未被写入主存时,变为M状态。
S:共享状态,代表数据可能被多个CPU进行缓存,并且各缓存中数据与主存数据一致,当一个CPU修改该缓存行时,其他CPU从该缓存行可被作废,变成无效状态。
I:无效状态,其他CPU修改了该缓存行。
与之对应的四种操作:
local read:读本地缓存中的数据。
local write:将数据写到本地的缓存里面。
remote read:将内存中的数据读取过来。
remote wrte:将数据写回主存。
2.2 CPU多级缓存-乱序执行优化:
定义:处理器为提高运算速度而做出违背代码原有顺序的优化。在多核环境下会出现数据错误的问题。
2.3 Java内存模型(Java Memory Model)
JMM规范了JVM与计算机内存如何协同工作,规定了线程何时可以看到和修改其他线程修改过的共享变量的值以及在必须时同步地访问共享变量。
存放在栈里的多个线程同时访问同一个对象地同一个方法,他们同时也访问了该对象的成员变量,但这些线程都拥有了该成员变量的私有拷贝。
计算机系统简单示意图:
每个CPU都包含一系列的CPU寄存器,它们是CPU内存的基础。
线程与JMM及共享变量的关系:
Java内存模型中同步的八种操作:
1、lock(锁定):作用于主内存的变量,把一个变量标识为一条线程独占状态。
2、unlock(解锁):作用于主内存的变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
3、read(读取):作用于主内存的变量,把一个变量值从主内存传输到线程的工作内存中,以便以后的load动作使用
4、load(载入):作用于工作内存(缓存和寄存器)的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
5、use(使用):作用于工作内存的变量,把工作内存中的一个变量值传递给执行引擎
6、assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋值给工作内存的变量。
7、store(存储):作用于工作内存的变量,把工作内存中的一个变量的值传送到主内存中,以便随后的write的操作。
8、write(写入):作用于主内存的变量,它把store操作送回主内存的变量传送到主内存的变量中。
Java内存模型规定的同步规则:
1、如果要把一个变量从主内存中复制到工作内存,就需要按顺序地执行read和load操作,如果把变量从工作内存中同步回主内存中,就需要按顺序地执行store和write操作。但java内存模型只要求上述操作必须按顺序执行,而没有保证必须是连续执行。
2、不允许read和reload,store和write操作之一单独出现。
3、不允许一个线程丢弃它的最近的assign的操作,即变量在工作内存中改变了之后必须同步到主内存中。
4、不允许一个线程无原因地(没发生过任何assign操作)把数据从工作内存同步到主内存中。
5、一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量,即就是对一个变量实施use和store之前,必须先执行过了assign和load操作。
6、一个变量在同一时刻只允许一条线程对其进行lock操作,但lock操作可被同一条线程执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁,lock和unlock必须成对出现。
7、如果对一个变量执行lock操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值。
8、如果一个变量事先没有被lock操作锁定,则不允许对它执行unlock操作;也不允许去unlock一个被其他线程锁定的变量。
9、对一个变量执行unlock操作前,必须先把此变量同步到主内存中(执行store和write操作)。