前言
高并发: 很多用户同时访问这个服务器,这个服务器不能失能.
高并发是互联网应用的一大特点,也是互联网应用不可避免地一个问题;比如: 淘宝双11购物狂欢节,京东618购物促销节,12306春节火车票,促销,秒杀等.
解决高并发问题是一个系统工程,需要站在全局高度统筹谋划,从多个角度进行架构设计.
解决高并发问题,不是一个或两个方案就能解决的,需要从各个维度综合施策才能完成.
解决方案
1. 硬件
(1)概述
系统访问用户增多,流量增大,导致服务器压力增大,出现性能瓶颈,我们可以采用一个简单粗暴的策略: 提升服务器硬件配置的策略,也称为: 单体应用垂直扩容.
(2)单体应用垂直扩容方案
· CPU从32位提升为64位
· 内容从64GB提升为256GB(比如缓存服务器)
· 磁盘从HDD(Hard Disk Drive)提升为SSD(固态硬盘(Solid State Drives)),有大量读写的应用
· 磁盘扩容,1TB扩展到2TB,比如文件系统
· 千兆网卡提升为万兆网卡
但是不管怎么提升硬件性能,硬件性能的提升不可能永无止境,所以最终还是要靠分布式解决
2. 缓存
(1)概述
缓存可以说是解决大流量高并发,优化系统性能非常重要的一个策略.
缓存在高并发系统中无处不在.
(2)HTTP缓存
① 浏览器缓存
浏览器缓存是指当我们使用浏览器访问一些网站页面或者HTTP服务时,根据服务器端返回的缓存设置响应头将响应内容缓存到浏览器,下次可以直接使用缓存内容或者仅需要去服务器端验证内容是否过期即可,这样可以减少浏览器和服务器之间来回传输的数据量,节省带宽,提升性能.
比如新浪:
② Nginx缓存
Nginx提供了expires命令来实现缓存控制,比如:
location /static {
root /opt/static/;
expires 1d;//全天
}
当用户访问时,Nginx拦截到请求后先从Nginx本地缓存查询数据,如果有并且没有过期,则直接返回缓存内容.
③ CDN缓存
CDN的全称是Content Delivery Network,即内容分发网络.CDN是构建在网络之上的内容分发网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取内容,降低网络拥塞,提高用户访问响应速度和命中率.CDN的关键技术主要有内容存储和分发技术.
CDN它本身也是一个缓存,它把后端应用的数据缓存起来,用户要访问的时候,直接从CDN上获取,不需要走后端的Nginx,以及具体应用服务器Tomcat,它的作用主要是加速数据的传输,也提高稳定性,如果从CDN上没有获取到数据,再走后端的Nginx缓存,Nginx上也没有,则走后端的应用服务器,CDN主要缓存静态资源.
(3)应用缓存
① 内存缓存
在内存中缓存数据,效率高,速度快,应用重启缓存丢失.
② 磁盘缓存
在磁盘缓存数据,读取效率较之内存缓存稍低,应用重启缓存不会丢失.
代码组件:Guava、Ehcache
服务器:Redis、MemCache
(4)多级缓存
在整个应用系统的不同层级进行数据的缓存,多层次缓存,来提升访问效率.
比如: 浏览器 => CDN => Nginx => DB(磁盘、文件系统).
(5)缓存的使用场景
· 经常需要读取的数据
· 频繁访问的数据
· 热点数据缓存
· IO瓶颈数据
· 计算昂贵的数据
· 无需实时更新的数据
· 缓存的目的是减少对后端服务的访问,降低后端服务的压力
3. 集群
有一个单体应用,当访问流量很大无法支撑,那么可以集群部署,也叫单体应用水平扩容.原来通过部署一台服务器提供服务,现在就多部署几台,那么服务的能力就会提升.
部署了多台服务器,但是用户访问入口只能是一个,比如: www.web.com,所以就需要负载均衡,负载均衡是应用集群扩容后的必须步骤,集群部署后,用户的会话Session状态要保持的话,就需要实现Session共享.
4. 拆分
(1)应用拆分
应用的拆分: 分布式(微服务)
单体应用,随着业务的发展,应用功能的增加,单体应用就逐步变得非常庞大,很多人维护这么一个系统,开发、测试、上线都会造成很大的问题,比如代码冲突,代码重复,逻辑错综混乱,代码逻辑复杂度增加,响应新需求的速度降低,隐藏的风险增大,所以需要按照业维度进行拆分,采用分布式开发.
应用拆分之后,就将原来在同一进程里的调用变成了远程方法调用,此时就需要使用到一些远程调用技术: HttpClient、Hessian、Dubbo、WebService等.
随着业务复杂度增加,我们需要采用一些开源方案进行开发,提升开发和维护效率,比如: Dubbo、SpringCloud.
通过应用拆分之后,扩容就变得容易,如果此时系统处理能力跟不上,只需要增加服务器即可(把拆分后的每一个服务再多做几个集群).
(2)数据库拆分
数据库拆分分为: 垂直拆分和水平拆分(分库分表).
按照业务维度把相同类型的表放在一个数据库,把另一些表放在另一个数据库,这种方式的拆分叫垂直拆分,也就是在不同库建不同表,把表分散到各个数据库.
比如产品、订单、用户三类数据以前在一个数据库中,现在可以用三个数据库,分别为 产品数据库、订单数据库、用户数据库.
这样可以将不同的数据库部署在不同的服务器上,提升单机容量和性能问题,也解决多个表之间的IO竞争问题.
根据数据行的特点和规则,将表中的某些行切分到一个数据库,而另外的某些行又切分到另一个数据库,这种方式的拆分叫水平拆分.
单库单表在数据量和流量增大的过程中,大表往往会成为性能瓶颈,所以数据表要进行水平拆分.
数据库拆分,采用一些开源方案,降低开发难度,比如: MyCat、ShardingSphere.
5. 静态化
对于一些访问量大,更新频率较低的数据,可直接定时生成静态html页面,供前端访问,而不是访问jsp.
常用静态化的技术: freemaker、velocity.
定时任务,每隔2分钟生成一次首页的静态化页面.
页面静态化首先可以大大提升访问速度,不需要去访问数据库或者缓存来获取数据,浏览器直接加载html页面即可.
页面静态化可以提升网站稳定性,如果程序或数据库出了问题,静态页面依然可以正常访问.
6. 动静分离
采用比如Nginx实现动静分离,Nginx负责处理静态资源,Tomcat负责处理动态资源.
Nginx的效率极高,利用它处理静态资源,可以为后端服务器分担压力.
Redis和Nginx并发量5万左右,Tomcat和Mysql700左右.当然可以通过一些方式调整.
7. 队列
· 采用队列是解决高并发大流量的利器
· 队列的作用就是: 异步处理/流量削峰/系统解耦
· 异步处理是使用队列的一个主要原因,比如注册成功了,发优惠券/送积分/送红包/发短信/发邮件等操作都可以异步处理
· 使用队列流量削峰,比如并发下单、秒杀等,可以考虑使用队列将请求暂时入队,通过队列的方式将流量削平,变成平缓请求进行处理,避免应用系统因瞬间的巨大压力而压垮.
· 使用队列实现系统解耦,比如支付成功了,发消息通知物流系统,发票系统,库存系统等,而无需直接调用这些系统.
队列应用场景
不是所有的处理都需要实时处理
不是所有的请求都必须要实时告诉用户结果
不是所有的请求都必须100%一次性处理成功
不知道哪个系统需要我的协助来实现它的业务处理,保证最终一致性,不需要强一致性.
常见的消息队列产品: ActiveMQ/RabbitMQ/RocketMQ/kafka
· ActiveMQ是jms规范下一个老牌的成熟的消息中间件/消息服务器.
· RabbitMQ/RocketMQ 数据可靠性极好,性能也非常优秀,在一些金融领域、电商领域使用很广泛;RocketMQ是阿里巴巴的.
· kafka主要运用在大数据领域,用于对数据的分析,日志的分析等处理,它有可能产生消息的丢失等问题,它追求性能,性能极好,不追求数据的可靠性.
8. 池化
在实际开发中,我们经常会采用一些池化技术,减少资源消耗,提升系统性能.
(1)对象池
通过复用对象,减少对象创建和垃圾收集器回收对象的资源开销.
可以采用commons-pool2实现.
实际项目采用对象池并不常见,主要在开发框架或组件的时候会采用.
(2)数据库连接池
Druid/DBCP/C3P0/BoneCP
(3)Redis连接池
JedisPool(内部基于commons-pool2实现)
(4)HttpClient连接池
核心实现类: PoolingClientConnectionManager
(5)线程池
Java提供java.util.concurrent包可以实现线程池
Executors.newFixedThreadPool(8);线程数量固定
Executors.newSingleThreadExecutor();只有一个线程,避免关闭情况
Executors.newCachedThreadPool();可以自动扩容
Executors.newScheduledThreadPool(10);每隔多久执行
9. 优化
(1)JVM优化
设置JVM参数
-server -Xmx4g -Xms4g -Xmn256m
-XX:PermSize=128m
-Xss256k
-XX:+DisableExplicitGC
-XX:+UseConcMarkSweepGC
-XX:+CMSParallelRemarkEnabled
-XX:+UseCMSCompactAtFullCollection
-XX:LargePageSizeInBytes=128m
-server VM有两种运行模式Server与Client,两种模式的区别在于,Client模式启动速度较快,Server模式启动较慢;但是启动进入稳定期长期运行之后Server模式的程序运行速度比Client要快很多;
-Xmx2g 最大堆大小
-Xms2g 初始堆大小
-Xmn256m 堆中年轻代大小;
-XX:PermSize设置非堆内存初始值,默认是物理内存的1/64;由XX:MaxPermSize设置最大非堆内存的大小,默认是物理内存的1/4.
-Xss 每个线程的Stack大小
-XX:+DisableExplicitGC,这个参数作用是禁止代码中显示调用GC。代码如何显示调用GC呢,通过System.gc()函数调用。如果加上了这个JVM启动参数,那么代码中调用System.gc()没有任何效果,相当于是没有这行代码一样。
-XX:+UseConcMarkSweepGC 并发标记清除(CMS)收集器,CMS收集器也被称为短暂停顿并发收集器;
-XX:+CMSParallelRemarkEnabled 降低标记停顿;
-XX:+UseCMSCompactAtFullCollection:使用并发收集器时,开启对年老代的压缩.
-XX:LargePageSizeInBytes 指定 Java heap 的分页页面大小
-XX:+UseFastAccessorMethods 原始类型的快速优化
-XX:+UseCMSInitiatingOccupancyOnly 使用手动定义的初始化定义开始CMS收集
-XX:CMSInitiatingOccupancyFraction 使用cms作为垃圾回收使用70%后开始CMS收集;
(2)Tomcat优化
• 设置JVM参数,可以参考JVM优化参数
在tomcat的bin目录下的catalina.sh中设置jvm参数:
JAVA_OPTS="-server -XX:+PrintGCDetails -Xmx4g -Xms4g -Xmn256m
-XX:PermSize=128m
-Xss256k
-XX:+DisableExplicitGC
-XX:+UseConcMarkSweepGC
-XX:+CMSParallelRemarkEnabled
-XX:+UseCMSCompactAtFullCollection
-XX:LargePageSizeInBytes=128m
-XX:+UseFastAccessorMethods
-XX:+UseCMSInitiatingOccupancyOnly
-XX:CMSInitiatingOccupancyFraction=70"
• 设置tomcat的线程池大小
• 设置 IO 模式
• 配置 APR
10. Java程序优化
· 养成良好的编程习惯
· 不要重复创建太多对象
· 流/文件/连接 一定要记得在finally块中关闭
· 少用重量级同步锁synchronized,采用Lock
· 不要在循环体中使用try/catch
· 多定义局部变量,少定义成员变量
11. 数据库优化
(1)数据库服务器优化
修改数据库服务器的配置文件的参数,偏DBA(数据库管理员)
(2)数据库架构优化
· 将数据库服务器和应用服务器分离
· 读写分离: 通过数据库主从架构解决,写数据时操作主库,读数据时操作从库,分摊读写压力
· 分库分表: 扩容数据库,解决数据量容量问题
(3)数据库索引优化
· 建立合适的索引
· 建立索引的字段尽量的小,最好是数值
· 尽量在唯一性高的字段上创建索引,主键,序号等
· 不要在性别这种唯一性很低的字段上创建索引
(4)SQL优化
sql优化有很多,可以总结出很多经验,在这里我就不具体阐述了,后面会再单独写一篇关于sql优化的内容
(5)采用数据搜索引擎
solr/elasticsearch
12. Nginx优化
调整配置文件参数
worker_processes 16;
gzip on; #开启gzip压缩输出
events {
worker_connections 65535; #极限值65535
multi_accept on; #开启多路连接
use epoll; #使用epoll模型
}
13. Linux优化
优化Linux内核参数
修改/etc/sysctl.conf
偏运维的职位
14. 网络优化
机房、带宽、路由器等方面优化
网络架构更合理
运维的职责
15. 前端优化
(1)js优化
• 压缩变小
• 压缩工具
• 多个js合并成一个js文件,直接手动拷贝到一个文件中去,页面只加载这一个文件或者利用程序,比如controller,/aa/js?path=xxx.js,xxx.js
(2)css优化
• 压缩变小
• 多个css文件合并成一个css文件
(3)html页面优化
• 不要加载太多js和css
• js和css加载放在页面的尾部,从用户体验角度考虑的
• 页面上减少到服务的请求数
16. 压测
• 压测就是压力测试
• 在系统上线前,需要对系统各个环节进行压力测试,发现系统的瓶颈点,然后对系统的瓶颈点,进行调优。调优完成后,还需要考虑另外一些风险因素,比如网络不稳定,机房故障等。所以我们需要提前有故障预备方案,比如多机房部署容灾、路由切换等。故障预备方案做好后,还需要提前进行演练,以确保预案的有效性
• 压力测试工具:Apache JMeter / LoadRunner等,偏测试的工作
• CTO、架构师,技术团队、测试团队、运维团队、DBA 等共同完成
总结
完成以上的工作,我们才能实现一个高并发、高可用、高性能的"三高"分布式系统.