今天开始阅读《并发编程的艺术》,从这篇博客开始进行简单的总结。
并发编程的目的是为了让程序运行的更快,能够多线操作。但是并不是启动更多的线程,就能让程序运行的更快。并发编程收到上下文切换、死锁、硬件资源与软件资源限制等挑战。
1. 上下文切换
当发生线程切换的时候,线程的执行环境也要切换(例如寄存器的值,所指向的栈等,进程还涉及到MMU),切换是有代价的(时间)。因此过于频繁的切换的代价,可能会抹去并发带来的好处。
如何减少上下文的切换?
- 使用无锁并发编程(多线程竞争锁的时候,引起上下文切换)
- CAS算法(不需要加锁来实现同步)
- 使用最少线程(避免创建多的多余线程,处于waiting状态,引起切换)
- 协程(使用单线程实现多任务的调度,并在单线程里维持多任务间的切换)
2.死锁
使用锁来解决并发问题是常见的思路,但是不合理的代码会引起死锁。即一组线程(进程)都持有资源,并且想要获取其他线程的资源,导致所有线程都无限等待的一种情况。
避免死锁:
- 避免一个线程同时获取多个锁
- 避免一个线程在锁内同时获取多个资源
- 使用定时锁
- 对于数据库锁,加锁和解锁必须在同一个连接里,否则就会出现解锁失败。
3.资源限制带来的挑战
资源的限制有带宽、IO性能,CPU的处理速度。 软件资源的限制有数据库的连接数、socket连接数等。并发编程时不应超过资源的限制,超过的结果就是,对资源的利用达到天花板后,增加线程并不会提高天花板,只会徒增多个线程切换带来的开销。
解决硬件资源限制: 使用集群的方式,例如Hadoop,进行数据的并行。
解决软件资源限制:使用pool的方式,例如线程池,数据库连接池,避免频繁的创建和销毁软件资源,带来的额外开销(内存的分配、回收,消耗的时间等)。
总而言之,并发的程度要匹配硬件资源和软件资源,达到资源的天花板是最大值,再增加并发只会增加切换带来的开销,不会增大对资源的并行程度。总体带来负面效果。