多线程+读写流+jvm溢出解决

最新推荐文章于 2024-04-12 23:58:44 发布

乎喜

最新推荐文章于 2024-04-12 23:58:44 发布

阅读量587

点赞数

分类专栏：面试题

本文链接：https://blog.csdn.net/k123006/article/details/83082926

版权

本文探讨了在处理大量数据（如10GB）时，如何利用多线程和读写流进行高效计算，以避免JVM内存溢出。通过在字节流和字符流中使用缓冲提高效率，并根据JVM默认内存设置（最大1.5GB）调整数据分批加载策略，采用8线程计算，实现了在10秒内完成10GB数据的求和操作。

摘要由CSDN通过智能技术生成

题目：读取10G的数据求和。

1.流的基本知识：

è¿éåå¾çæè¿°

字节流和字符流最大区别在，字符流在文件和流中间加了一层缓存。有人说用最好用字节流，速度上我感觉没得到很高提升，主要大多数文件缺失以字节存储比如视屏，图片。。。。

用那一个?统一用带Buffered ，一:效率更高。二：方法更全

2.jvm 内存限制。通常情况下jvm 的默认设置是最大空间是物理内存1/4 ，最小空间是物理内存的1/64 。本机是6G，所以jvm可以得到的最大内存是1.5G.一次加载10G的内容死啦死啦的。Oom是铁定跑不了。一台机器如何最快的求和。那么就分批次加载，为了最大的利用本机效能，一次读取1.5G 并分别在8线程上分别计算汇总。显然如果分别7台机子，最快2秒内就能计算完，流的反复读取是很耗时间的。但是大概10秒内也能完成10G数据统计。

如下工具进行分片：读取
raf = new RandomAccessFile(prth, "r");
MappedByteBuffer map = raf.getChannel().map(FileChannel.MapMode.READ_ONLY, offset, TSize);

线程池申请：最合适是当前cpu*2     
private static ThreadPoolExecutor poolExecutor = new ThreadPoolExecutor(threadn,
        threa

最低0.47元/天解锁文章

乎喜

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
多线程+读写流+jvm溢出解决

题目：读取10G的数据求和。 1.流的基本知识：字节流和字符流最大区别在，字符流在文件和流中间加了一层缓存。有人说用最好用字节流，速度上我感觉没得到很高提升，主要大多数文件缺失以字节存储比如视屏，图片。。。。用那一个?统一用带Buffered ，一:效率更高。二：方法更全 2.j...
复制链接

扫一扫

专栏目录