记一次使用Collections.synchronizedList和CopyOnWriteArrayList的经历
场景:根据所给的文件夹遍历该文件夹及其子文件夹下的所有文件,并进入文件读取数据再处理,得到我需要的信息,将信息存到到list中,再进行下一步的业务处理。
由于现场的文件很多、很多、很多。所以我用线程池去遍历给定的文件夹再将处理后的文件名存到List中。由于是并发场景,所有最开始我用CopyOnWriteArrayList去存数据。我遍历了一个小的文件夹,该文件夹中有29个文件,每个文件中20000多行的数据,也就是说我需要将60w+的数据存到list中。
程序运行之后,加上其他的业务,总共花费112s,也就是120s的时间。
很显然,性能不尽人意。
于是,网上查了查适合多线程,并且写入效率高的list。
Collections.synchronizedList写操作的性能较好,将CopyOnWriteArrayList换为Collections.synchronizedList,效率高了很多。程序运行时间平均花费300ms,时间最长的一次是400+ms。
这里借用一下博文:
CopyOnWriteArrayList和Collections.synchronizedList是实现线程安全的列表的两种方式。两种实现方式分别针对不同情况有不同的性能表现,其中CopyOnWriteArrayList的写操作性能较差,而多线程的读操作性能较好。而Collections.synchronizedList的写操作性能比CopyOnWriteArrayList在多线程操作的情况下要好很多,而读操作因为是采用了synchronized关键字的方式,其读操作性能并不如CopyOnWriteArrayList。因此在不同的应用场景下,应该选择不同的多线程安全实现类。
参考文章:
https://blog.csdn.net/Byd_chao/article/details/85232959