在 Unix编程艺术 中,提到了尽量避免多线程编程模型, 认为这样只会增加复杂度, 提倡使用多进程, 这样本质上就可以避免多线程『共享内存数据』产生的 “corruotped memory” 问题。
其中, 提到了一篇文章 Why Threads Are A Bad Idea, 对于多线程编程和事件编程分析的非常好, 具体的翻译如下:
1 介绍
线程的背景:
在操作系统中出现多线程
逐渐演变成 用户层面的编程工具
被认为是多种问题的一种通用解决方案
每一个程序员都需要成为 一个多线程编程的高手吗?
根本性的问题:
多线程的程序非常难以正确的编写!!!
替代性的方案:
使用事件驱动的编程方法
特别声明:
对于大部分的多线程程序,使用事件驱动是一个更好的选择
只有当使用CPU多核的时候, 才需要使用多线程编程
2 多线程的本质
一般用来管理并发问题
多个独立相互执行的任务
共享的内存
预先的安排机制(Pre-emptive scheduling)
同步机制(synchronization)
3 多线程的用途
操作系统: 对每一个用户进程分配一个内核线程
科学应用程序: 每个CPU分配一个线程(对计算要求性很高的程序)
分布式系统: 进程请求并行(同步记性的I/O操作)
GUIs程序
线程对应用户的行为. 在长时间的后台计算过程中仍然可以处理图形展示
多媒体, 动画方面的程序编写
4 多线程有什么问题?
对于一般的程序员而言,难以掌握。
即使对于专家,多线程编程也是痛苦的。
5 为什么多线程编程很难?
Synchronization(同步机制):
必须通过锁来共享数据
忘记了加锁?就会导致受污染的数据
死锁
依赖锁,会导致循环依赖
每个处理程序等待其他处理程序: 导致系统挂起
6 为什么多线程编程很难?
难以调试: 因为 数据依赖,时间依赖
线程破坏了抽象: 无法设计出模块化的程序
因为锁导致回调无法完成
7 为什么多线程编程很难?
很难达到非常好的性能
简单的锁导致了低并发
而精密的锁又会导致复杂度提升, 降低了一般情况下的性能
OSes限制了性能提升(调度, 环境切换)
线程不受支持
难以支持多线程代码(mac, windows)
一些标志库不是线程安全的
内核调用, windows系统不是多线程
很少有多线程编程的调试工具
通常不需要并发场景
8 时间驱动编程
一个执行流进程: 没有CPU的并发
在时间上注册消息(通过回调)
事件轮询等待消息, 调用处理器模型
时间处理器没有抢断
处理器通常是 短生命周期的
9 事件驱动编程被用来干什么
大多数的GUIs编程:
一个处理器对应一个事件
处理器用来执行行为(撤销,删除文件等)
分布式系统
一个处理器用来对应一个输入源
处理进来的请求,返回结果
事件驱动的I/O 来处理 I/O并发
10 事件驱动编程的问题
长时间运行的时间处理器会导致 程序没有反应, 解决办法:
对于长时间运行的程序Fork off子程序处理, 当处理结束后使用事件
打断处理器执行(比如: 事件驱动的I/O)
定期回调 时间处理器中的 事件循环
通过处理器无法维护本地内存状态(处理器必须返回)
没有CPU的并发(不太合适科学计算程序)
事件驱动的编程并不总是被支持
11 多线程编程 VS 事件驱动编程
事件驱动编发编程尽可能的避免 并发, 而多线程编程则倾向于并发:
使用事件驱动编程更加容易: 不用考虑并发, 不用考虑抢占, 不用考虑同步和死锁
只在特定的情况下,才使用复杂的技术栈
使用多线程编程, 即使最简单的程序也需要面对很高的复杂度(full complexity)
使用事件驱动更加容易调试
事件驱动编程只和时间依赖有关, 不需要考虑内部的调度
问题更加容易跟踪: 较慢的按钮点击反应 和 内存数据污染 时候, 前者问题更加容易定位
12 多线程编程 VS 事件驱动编程
在单个CPU上时间驱动程序比线程更加快速
没有锁的覆盖
没有上下文环境的 切换
事件驱动编程更加面向接口编程
多线程提供了真正的并发性
对于多CPU的机器来说,是可以扩展性能
可以长时间的运行处理程序而不需要冻结
13 你需要放弃多线程吗?
不需要的情况: 对于应该程序性能要求很高的服务(比如: 数据库服务器)
但是, 尽可能的避免多线程编程:
对于 GUIs程序, 分布式系统, 性能要求不高的, 使用事件编程, 不是多线程
只有当真正的多核CPU并发需要使用到的时候,使用多线程编程
当使用多线程编程的时候,将多线程编程模块与其他模块进行隔离, 保持大部分代码都是单线程模型
隔离多线程的模块:
14 总结
并发从根本上是很难的, 尽可能的避免
多线程比事件更加强大,但是这种强大的功能很少真正需要
多线程编程比事件编程更加难以写出正确的代码, 只有真正的专家才能掌握
将事件 编程当做基本的开发工具(对于GUIs 和 分布式系统)
只有当性能要求很高的服务时候,才使用 多线程