在优化性能之前,首先要清楚木桶原理:
系统的最终性能取决于系统中性能表现最差的组件.
程序的性能一般为如下几个方面:
(1)执行速度: 程序的反映是否迅速,响应时间是否足够短.
(2)内存分配: 内存分配是否合理,是否过多地消耗内存或者存在泄漏
(3)启动时间: 程序从运行到可以正常处理业务需要花费多长时间
(4)负载承受能力: 当系统压力上升时,系统的执行速度,响应时间的上升曲线是否平缓
性能的参考指标:
执行时间: 一段代码从开始到结束所使用的时间
CPU时间: 函数或者线程占用CPU的时间
内存分配: 程序在运行时占用的内存时间
磁盘吞吐量: 描述I/O的使用情况
网络吞吐量: 描述网络的使用情况
响应时间 :系统对某用户行为或者事件做出响应的时间.
最有可能成为系统瓶颈的计算资源如下:
磁盘I/O: 磁盘读写的速度要比内存慢很多
网络操作: 网络操作的速度可能比本地IO更慢.
CPU: 科学计算,3D渲染等对CPU需求旺盛的应用.
异常: 对Java应用来说,异常的捕获和处理是非常消耗资源的.
数据库: 操作时等待数据库的响应速度.
锁竞争: 对高并发程序来说, 如果存在激烈的锁竞争,无疑是对性能极大的打击.
内存: 一般来说,内存在读写速度上不太可能成为性能瓶颈.
加速比 = 优化前系统耗时 / 优化后系统耗时
加速比越高, 表明优化效果越明显.
性能优化的层次:
代码优化
软件架构上
JVM虚拟机层
数据库
操作系统层面
数据库调优:
在应用层对SQL语句进行优化
对数据库进行优化
对数据库软件进行优化
这里举一个简单的优化方法 PreparedStatement来代替Statement 优点如下:
(1)代码的可读性和可维护性.
(2)PreparedStatement尽最大可能提高性能.
(3)最重要的一点是极大地提高了安全性.
善用设计模式:
首先了解一个概念: 延迟加载: 如果没有使用当前对象或是组件,则不需要真正的初始化它.
然后进入正题, 一般提到设计模式 ,大家首先想到的就是单例模式,它的好处如下:
(1)对于频繁使用的对象, 可以省略创建对象所花费的时间,尤其是对于重量级的对象来说,可以省掉非常可观的一笔系统开销.
(2)由于new操作的次数减少,因而对系统内存的使用频率也会降低,这将减轻GC压力,缩短GC缩短时间
但是要注意的地方就是: 序列化和反序列化可能会破坏单例.
代理模式, 使用代理对象完成用户请求, 屏蔽用户对真实对象的访问.
最常见的应用场景就是平时操作数据库的时候, jdbc等数据库连接对象都是已经创建好的, 调用时就省去了初始化这种连接数据库engine的时间
动态代理, 运行时动态生成代理类.
享元模式, 是设计模式中少数几个以提高系统性能为目的的模式之一, 如果系统中存在多个相同的对象,那么只需共享一份对象的拷贝, 而不必为每一次使用都创建新的对象.
它的核心是享元工厂, 需要确保系统可以共享相同的对象.
主要优点:
(1)可以节省重复创建对象的开销
(2)由于创建对象的数量减少, 所以对系统内存的需求也减少.
装饰者模式,可以动态添加功能. 代码重用使用的是委托机制而不是继承, 因为继承是一种紧密耦合,父类如果改动还要改动子类.
JDK中outputStream和InputStream类族的实现是装饰者模式的典型应用.
观察者模式, 当一个对象的行为依赖于另一个对象的状态时, 观察者模式就相当有用.
观察者模式可以用于事件监听, 通知发布等场合. 可以确保观察者在不使用监控的情况下, 及时收到相关消息和事件.
常用优化组件和方法:
(1)缓冲: 缓冲区是一块特定的内存区域,jdk中很多I/O组件都提供了缓冲功能,
(2)缓存: 缓存也是一块为提升系统性能而开辟的内存空间.
(3)并行替代串行,随着多核时代的到来,CPU的并行能力有了很大的提升,在这个背景下 单纯的串行已经不能满足.java中 提供了Thread对象和runnable接口用于创建进程内的线程.
(4)负载均衡: 并发数很多的情况下,单台计算机无法承受, 这时候一般都可以搭建服务器集群.
在使用tomcat集群时,有两种基本的session共享模式, 黏性session模式 (一台用户只能在一个机器上操作, 不能共享)和复制session模式(所有session在所有tomcat节点上,一般情况还是用这种合适).
字符串优化处理
string对象及其特点:
首先要了解string类型的3个基本特点:
(1)不变性.
(2)针对常量池的优化
(3)类的final定义 (不可能有任何子类, 这是对系统安全性的保护)
注意: 不变模式是一个可以提高多线程程序性能 , 降低多线程程序复杂度的设计模式.
StringBuffer 和 StringBuilder
(1)String常量的累加操作
String result = "aaa" + "bbb" + "ccc";
StringBuilder result = new StringBuilder();
result.append("aaa");
result.append("bbb");
result.append("ccc");
以上这两种方法我觉得大多数人 都会以为是 第二种效率更高,但实际上恰恰相反, 因为对于静态字符串的连接操作, Java在编译时会进行彻底的优化, 将多个连接操作的字符串在编译时合成一个单独的长字符串.
(2)String变量的累加操作
String str1= "aaa";
String str2 = "bbb";
String str3 = "ccc";
String result = str1 + str2 + str3;
这段代码其实是和 StringBuilder执行速度一样的, 因为对于变量字符串的累加,Java也做了相应的优化操作, 使用了StringBuilder对象来实现字符串的累加.
总结一下: 在无需考虑线程安全的情况下可以使用性能较好的StringBuiler, 但若系统有线程安全要求, 只能选择StringBuffer.
两者都可以设置一个容量参数, 在不指定容量参数时, 默认是16个字节.扩容策略是将原有的容量大小翻倍.
核心数据结构:
Set接口:
Set集合中的元素是不能重复的. 基于Set的重要实现有以下三种 : HashSet LinkedHashset TreeSet
这三种跟Map基本都是对应起来的 . HashSet的输出毫无规律可言 , LinkedHashMap的输出顺序跟输入顺序完全一致 ,TreeSet则将所有输出从小到大排序.
List接口:
这里我们只讨论3种最重要的List实现: ArrayList Vector 和 LinkedList .
这三种List均来自AbstratList的实现. 而AbstratList直接实现了List接口, 并扩展自AbstratCollection.
ArrayList Vector 均使用了数组实现, 使用了几乎相同的算法 ,唯一的区别可以认为是对多线程的支持. 没有实现线程同步的ArrayList要稍好于Vector ,但差别不是很明显.
LinkedList链表由一系列表项连接而成. 一个表项总是包含3个部分: 元素内容 , 前驱表项, 后驱表项.
ArrayList中的add() 性能取决于ensureCapacity()方法, 处理容量参数为10 如果容量不够的话 自增到原来的1.5倍 . 如果能确定集合的大小 可以直接指定容量参数的大小这样性能会提升很多.
LinkedList由于使用了链表的结构, 因此不需要维护容量的大小. 然而 每次元素增加都需要新建一个Entry对象, 并进行更多的赋值操作, 在频繁的系统调用中, 对性能会产生一定的影响.
但是 , 如果是在任意位置新增或者删除元素 ,而不是在队尾新增 , 则比ArrayList 效率高非常多.ArrayList 在任意位置新增或删除时都要重新将元素复制一遍, 打破原有的数组排列顺序.
常用的集合遍历方法有3种:
Foreach , 迭代器 和 for循环
总结: 对ArrayList这些底层用数组实现来说, 随机访问的速度是很快的. 可以优先考虑
Map接口:
围绕map接口, 最主要的实现类有HashTable (子类中还有properties类的实现) HashMap LinkedHashMap 和 TreeMap .
首先解决一下HashMap 和 HashTable的异同 (同步 / key,value的要求 / 算法):
HashTable大部分方法同步, 线程安全, key 和 value的值 不允许使用null值, 而HashMap可以.
内部索引的映射算法不同.
尽管存在以上的诸多问题 , 但是两者实现的性能相差无几.
因为HashMap被广泛应用, 这里将一下HashMap的实现原理, 主要是将key作为hash算法, 然后将hash值映射到内存地址, 直接取得所对应的数据. 底层使用的数据结构是数组, 所谓的内存地址即数组的下标索引.
HashMap的高性能需要保证以下几点:
hash算法必须是高效的; hash值到内存地址(数组索引)的算法是快速的 ; 根据内存地址(数组索引) 可以直接取得对应的值.
HashMap初始大小为16, 最大长度是2的30次方,load factor默认是0.75,扩充的临界值是16*0.75=12 负载因子 = 元素个数 / 内部数组总大小
LinkedHashMap --> 有序的HashMap , HashMap最大功能缺点是他的无序性.
LinkedHashMap提供两种类型的排序: 一是元素插入时的顺序, 二是最近访问的顺序.
可以通过以下构造参数指定排序行为 :
public LinkedHashMap(int initialCapacity, float loadFactor ,boolean accessOrder) , 其中accessOrder为true时按照元素最后访问时间排序;
当assessOrder为false时 ,按照插入顺序排序默认为false.
TreeMap
从功能上讲 ,TreeMap有着比HashMap更为强大的功能, 它实现了SortedMap接口, 可以对元素进行排序
这两种可以排序的Map实现的区别: LinkedHashMap是基于元素进入集合的顺序排序, 而TreeMap则是基于元素的固有顺序(由Comparator或者 Comparable确定)
使用NIO (New I/O)提升性能:
由于I/O的速度要比内存慢 , 因此 ,在很多情况下 I/O 都会成为系统的瓶颈. 特性如下:
为所有的原始类型提供(Buffer)缓存支持;
增加通道(Channel)对象 , 作为新的原始I/O 抽象;
支持锁和内存映射文件的文件访问接口;
提供了基于Selector的异步网络 I/O
跟JDK1.4之前的区别是 : 之前的I/O是 流式 ,NIO是基于块(Block)的, 它是块为基本单位处理数据.在NIO中, 最为重要的两个组件是缓冲Buffer 和 通道 Channel.
缓冲是一块连续的内存块 , 是NIO读写数据的中转地 通道表示缓冲数据的源头或者目的地. 它用于向缓冲读写或者写入数据. 是访问缓冲的接口.
Buffer的基本原理 :
Buffer中有3个重要的参数 : 位置 (position),容量(capactiy) 和 上限(limit) .
强引用:
可以直接访问目标对象 ;
强引用所指向的对象在任何时候都不会被系统回收. JVM宁愿抛出OOM异常, 也不回收强引用所指向的对象;
强引用可能导致内存泄漏 .
有助于改善性能的技巧:
(1) 慎用异常: try-catch 对系统性能会造成影响
(2) 使用局部变量 : 局部变量的访问速度远远高于类的成员变量.
(3) 位运算代替乘除法: 在所有的运算中, 位运算是最为高效的, 最典型的就是对于整数的乘除运算优化.
a *=2 ; 优化为 : a <<=1;
a /=2 ; 优化为: a >>=1;
(4) 一维数组代替二维数组
(5)提取表达式 : 很多通用的代码 只需要初始化一次就可以了.
(6)使用buffer代替 I/O操作
(7)使用clone() 代替new
(8)用静态方法代替实例方法 : 对于一些工具类, 应该使用static方法实现 ,这样不仅可以加快函数调用的速度, 同时, 调用static方法也不需要生成类的实例,
比调用实例方法更为方便, 易用.
JDK多任务执行框架
线程的数量必须得到控制, 盲目地大量创建线程对系统性能是有伤害的.
线程池: 基本功能就是进行线程的复用.
使用线程池后, 线程的创建和关闭通常由线程池维护, 线程通常不会因为执行完一次任务而关闭, 线程池中的线程会被多个任务重复使用.
线程池的大小对系统性能有一定的影响. 一般来说 只要避免掉极大和极小的两种情况就可以了.<<java并发>>
Ncpu = CPU的数量
Ucpu = 目标CPU的使用率 , 0<=Ucpu<=1
W/C = 等待时间与计算时间的比率
最优线程池的大小等于 : Ncpu * Ucpu * (1 + W/C)
java中可以通过 Runtime.getRuntime().availableProcessors(); 获取cpu的个数.
JDK并发数据结构
着重介绍一些用于多线程环境的数据结构, 如并发list 并发set 并发map等.
并发list:
ArrayList不是线程安全的. 应该尽量避免在多线程环境中使用ArrayList ,如果因为某些原因必须使用的,则需要使用:
Collections.synchronizedList(List list) 进行包装.
同步关键字 synchronized 是 Java语言中最为常用的同步方法之一. 虽然 synchronized可以保证对象或者代码段的线程安全.
为了实现多线程间的交互 ,还需要使用Object对象的wait() 和 notify() 方法.
"锁"的性能和优化
在高并发的环境下, 激烈的锁竞争会导致程序的性能下降, 这边简单的介绍常见的锁:
线程的开销 , 避免死锁 , 减小锁持有时间 , 减小锁粒度 ,读写分离锁来替换独占锁, 锁分离 ,锁粗化, 自旋锁, 锁消除 , 锁偏向
JVM调优
由于java字节码是运行在JVM虚拟机上的, 同样的字节码使用不同的JVM虚拟机参数运行 ,其性能表现可能就不一样.
垃圾回收基础
Java语言的一大特点是可以进行自动垃圾回收处理. 但是当内存释放不够完全时, 即存在分配但永不释放的内存块 ,就会引起内存泄漏.严重时,导致程序瘫痪.
垃圾处理器的基本问题是:
哪些对象需要回收?
何时回收这些对象?
如何回收这些对象?
垃圾回收算法与思想:
1. 引用计数法
2. 标记-清除算法
3.复制算法
4.标记-压缩算法