当提起这三个词的时候,是不是很多人都认为分布式=高并发=多线程?
当面试官问到高并发系统可以采用哪些手段来解决,或者被问到分布式系统如何解决一致性的问题,是不是一脸懵逼?
确实,在一开始接触的时候,不少人都会将三者混淆,误以为所谓的分布式高并发的系统就是能同时供海量用户访问,而采用多线程手段不就是可以提供系统的并发能力吗?
实际上,他们三个总是相伴而生,但侧重点又有不同。
什么是分布式?
分布式更多的一个概念,是为了解决单个物理服务器容量和性能瓶颈问题而采用的优化手段。
该领域需要解决的问题极多,在不同的技术层面上,又包括:分布式文件系统、分布式缓存、分布式数据库、分布式计算等,一些名词如Hadoop、zookeeper、MQ等都跟分布式有关。
从理念上讲,分布式的实现有两种形式:
水平扩展:当一台机器扛不住流量时,就通过添加机器的方式,将流量平分到所有服务器上,所有机器都可以提供相当的服务;
垂直拆分:前端有多种查询需求时,一台机器扛不住,可以将不同的需求分发到不同的机器上,比如A机器处理余票查询的请求,B机器处理支付的请求。
什么是高并发?
相对于分布式来讲,高并发在解决的问题上会集中一些,其反应的是同时有多少量:比如在线直播服务,同时有上万人观看。
高并发可以通过分布式技术去解决,将并发流量分到不同的物理服务器上。
但除此之外,还可以有很多其他优化手段:比如使用缓存系统,将所有的,静态内容放到CDN等;还可以使用多线程技术将一台服务器的服务能力最大化。
什么是多线程?
多线程是指从软件或者硬件上实现多个线程并发执行的技术,它更多的是解决CPU调度多个进程的问题,从而让这些进程看上去是同时执行(实际是交替运行的)。
这几个概念中,多线程解决的问题是最明确的,手段也是比较单一的,基本上遇到的最大问题就是线程安全。
在JAVA语言中,需要对JVM内存模型、指令重排等深入了解,才能写出一份高质量的多线程代码。
总结一下:
●分布式是从物理资源的角度去将不同的机器组成一个整体对外服务,技术范围非常广且难度非常大,有了这个基础,高并发、高吞吐等系统很容易构建;
● 高并发是从业务角度去描述系统的能力,实现高并发的手段可以采用分布式,也可以采用诸如缓存、CDN等,当然也包括多线程;
● 多线程则聚焦于如何使用编程语言将CPU调度能力最大化。
分布式与高并发系统,涉及到大量的概念和知识点,如果没有系统的学习,很容易会杂糅概念而辨识不清,在面试与实际工作中都会遇到困难。这些知识点,可以按照以下的思维导图系统性的学习。
Java多线程与高并发实战实践
先来看看高并发多线程一些大厂并发面试题,看你能答出几道!
(1)synchronized的CPU原语级别是如何实现的?
(2)无锁、偏向锁、轻量级锁、重量级锁有什么差别,升级过程如何?
(3)线程间通信,同机器进程间通信,跨机器进程间通信,各有什么方法?
(4)下列三种业务,应该如何使用线程池:
- 高并发、任务执行时间短的业务
- 并发不高、任务执行时间长的业务
- 并发高、业务执行时间长的业务
(5)秒杀系统,如何能够撑住100W级别TPS(淘宝最高54万TPS)?
如果平时只有CRUD的经验,不了解多线程与高并发,面对这样面试题,大概率一头雾水。
Java高并发常问面试题
- synchronized关键字的字节码原语;
- volatile关键字的字节码原语;
- synchronized与volatile的硬件级实现;
- 无锁、偏向锁、轻量级锁、重量级锁的升级过程;
- 内存屏障的基本概念;
- JVM规范如何要求内存屏障;
- 硬件层级内存屏障如何帮助java实现高并发;
- 面试第3题(线程间通讯)的8种解法;
Java多线程一线互联网常问面试题
- 线程池的学与思;
- 使用线程池的好与不好;
- 为什么阿里开发手册建议自定义线程池;
- 自定义线程池的最佳实践;
- 常见线程池类型与应用场景:
- 比线程更牛X的线程,压测结果展现纤程的威力;
Java多线程
Java多线程技能
- 进程和多线程的概念及线程的优点
- 使用多线程
- currentThread 0方法
- isAlive 0方法
- sleep 0方法
- getId0方法
- 停止线程
- 暂停线程
- yie1d方法
- 线程的优先级
- 守护线程
对象及变量的并发访问
- synchroni zed同步方法
- synchroni red同步语句块
- volatile关键字
线程间通信
- 等待/通知机制
- 方法join的使用
- 类ThreadLoca1的使用
- 类Inheri tabl eThreadLocea1的使用
Lock的使用
- 使用Reentr antLock类
- 使用Reentr antReadWr iteLock类
定时器Timer
- 定时器Timer的使用
单例模式与多线程
- 立即加载/“饿汉模式”
- 延迟加载/“懒汉模式”
- 使用静态内置类实现单例模式
- 序列化与反序列化的单例模式实现
- 使用stati e代码块实现单例模式
- 使用enum枚举数据类型实现单例模
- 完善使用enum枚举实现单例模式
拾遗增补
- 线程的状态
- 线程组
- 使线程具有有序性
- Simpl eDateP ormat非线程安全
- 线程中出现异常的处理
- 线程组内处理异常
- 线程异常处理的传递
Java高并发实战
基础—结构化并发应用程序—活跃性、性能与测试—高级主题
基础知识
- 线程安全性
- 对象的共享
- 对象的组合
- 基础构建模块
线程安全性
- 什么是线程安全性
- 原子性
- 竞态条件
- 示例:延迟初始化中的竞态条件
- 复合操作
- 加锁机制
- 内置锁
- 重入
- 用锁来保护状态
- 活跃性与性能
对象的共享
- 可见性
- 失效数据
- 非原子的64位操作
- 加锁与可见性
- Volatile变量
- 发布与逸出
- 线程封闭
- Ad-hoc线程 封闭
- 栈封闭
- ThreadLoca1类
- 不变性
- Final域
- 示例:使用Volatile类型来发布不可变对象
- 安全发布
- 不正确的发布:正确的对象被破坏
- 不可变对象与初始化安全性
- 安全发布的常用模式
- 事实不可变对象
- 可变对象
- 安全地共享对象
对象的组合
- 设计线程安全的类
- 收集同步需求
- 依赖状态的操作
- 状态的所有权
- 实例封闭
- Java监视器模式
- 示例:车辆追踪
- 线程安全性的委托
- 示例:基于委托的车辆追踪器
- 独立的状态变里
- 当委托失效时
- 发布底层的状态变量
- 示例:发布状态的车辆追踪器
- 在现有的线程安全类中添加功能
- 客户端加锁机制
- 组合
- 将同步策略文档化
基础构建模块
- 同步容器类
- 同步容器类的问题
- 迭代器与Concurr ent-Modi ficatExcepti on
- 隐藏迭代器
- 并发容器
- Concurr entHashMap
- 额外的原子Map操作
- CopyOnYri teArr ayList
- 阻塞队列和生产者消费者模式
- 示例:桌面搜索
- 串行线程封闭
- 双端队列与工作密职
- 阻塞方法与中断方法
- 同步工具类
- 闭锁
- Futur eT ask
- 信号量
- 栅栏
结构化并发应用程序
- 任务执行
- 取消与关闭
- 线程池的使用
- 图形用户界面应用程序
任务执行
取消与关闭
线程池的使用
图形用户界面应用程序
活跃性、性能与测试
- 避免活跃性危险
- 性能与可伸缩性
- 并发程序的测试
避免活跃性危险
性能与可伸缩性
并发程序的测试
高级主题
- 显式锁
- 构建自定义的同步工具
- 原子变里与非阻塞同步机制
- Java内存模型
显式锁
- Lock与Keentr antLock
- 轮询锁与定时锁
- 可中断的锁获取操作
- 非块结构的加锁
- 性能考 虑因素
- 公平性
构建自定义的同步工具
- 状态依赖性的管理
- 示例:将前提条件的失败传递给调用者
- 示例:通过轮询与休眠来实现
- 简单的阻塞
- 条件队列
- 使用条件队列
- 条件谓词
- 过早唤醒
- 丢失的信号
原子变里与非阻塞同步机制
- Lock与Keentr antLock
- 轮询锁与定时锁
- 可中断的锁获取操作
- 非块结构的加锁
- 性能考虑因素
- 公平性
- 在synchu oni red和Reentr antLock之间进行选择
- 读-写锁
Java内存模型
- 什么是内存模型,为什么需要它
- 平台的内存模型
- 重排序
- Java内存模型简介
- 借助同步
- 发布
- 不安全的发布
- 安全的发布
- 安全初始化模式
- 双重检查加锁
- 初始化过程中的安全性
分布式