通过ftp采集文件的性能总结

最新推荐文章于 2024-04-29 15:30:10 发布

魏大宾

最新推荐文章于 2024-04-29 15:30:10 发布

阅读量3.8k

点赞数

分类专栏：服务器端开发数据采集 JavaEE 文章标签：性能测试开源框架流机制 java csvreader

本文链接：https://blog.csdn.net/weibin_6388/article/details/50616901

版权

11 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

通过ftp采集文件数据的性能总结

在数据采集的过程中，使用excel或csv的格式将数据上传到服务器上，再通过Java的文件操作和流操作，获取上传文件的信息，最后通过CSVReader读取上传的文件信息，最后通过jdbc接口将文件信息存储到数据库中。

本篇文章主要研究在使用java的各种开源框架采集ftp上传的数据时，如何可以快速的上传数据，同时保证比较少的系统资源的消耗。

性能测试是在优化jdbc接口之后，使用大批量数据测试扫描存储文件的性能。测试时单次存储5条数据。使用的是批量接口。

系统配置如下：

应用服务器：

1， cpu inteli3

2，内存 8G

数据库服务器：

1，cpu Intel(R)Xeon(R) CPU

2，内存 4G

3，使用的是mysql数据库

进行批量测试的性能指标如下：

插入条数	使用时间（ms）	服务器内存消耗	数据库服务器内存消耗	碰到问题
100	833	35.5M	15.7%
1000	3971	54.5M	15.7%
10000	13399	111.5M	15.7%
20000	19639	154M	15.7%
30000	27308	188M	14.7%
100000	90039 (1.5min)	453M	15.7%
200000	204598(3.4min)	847M	15.7%
300000	295438(4.9min)	1014M	15.7%
400000	1093927(18.2min)	1292M	15.7%
500000	1570964(26.2min)	1433M	15.7%
600000	1668328(27.8min)	1780M	15.7%
700000	2372982(39.5min)	1855M	15.7%
800000	2865081(47.8min)	2015M	15.7%
900000	3584745(59.7min)	2129M	15.7%	单笔90万条消耗时间比较长
1000000		2095M		java.lang.OutOfMemoryError: GC overhead limit exceeded

将数组获取到的数据，在插入数据库时，单次批量插入10000。测试结果如下。

采用Java流机制，在插入数据库时，单次批量插入10000。测试结果如下。

减少创建对象，优化程序。测试结果如下。

通过ftp机制采集数据，在数据量比较大的情况下，有两条优化思路，一条是使用批量插入时控制好批量插入单次的条数。第二条是最好使用底层的机制，开源软件有时在设计时考虑的东西太多，会增加系统的资源消耗。

关注