java处理大文件方案

最新推荐文章于 2024-09-24 10:52:58 发布

neo_sparker

最新推荐文章于 2024-09-24 10:52:58 发布

阅读量1k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013995172/article/details/42582491

版权

在进行数据挖掘的时候，常常需要对数据进行预处理和归一化，当数据量比较小的时候，使用简单的java读写就可以解决问题，但是当数据量一旦太大的时候，比如2个G以上，数据量在百万级的时候，这个时候就容易内存溢出了，因为对于一个pc机根本没有那么大的内存，在公司使用64G内存的服务器时，都出现了内存溢出，所以才有了那篇jvm参数优化的博客(JVM 参数设置bug)，因此如何在有限制的内存中，进行高效的读写和数据处理，就是一个很大的问题。

解决方案：

方案1：使用单线程，分多次处理，每一次都是边读边处理的方式。

方案2：使用多线程，一个线程读，一个处理，一个线程写。

引用的参考资料如下：

1.java解决大数据读写问题：http://blog.csdn.net/zhxue123/article/details/5064690

2.java多线程分片处理大文本文件：http://bbs.csdn.net/topics/390439099?page=1

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。