多线程将提高您的性能,但您需要知道几件事情:
>每个线程都需要自己的JDBC连接.线程之间无法共享连接,因为每个连接也是一个事务.
>以数据块的形式上传数据,一次提交一次,以避免累积大量的回滚/撤销表.
>将任务切成几个单位,每个单位做一个工作.
要阐述最后一点:目前,您有一个任务读取文件,解析它,打开JDBC连接,进行一些计算,将数据发送到数据库等.
你应该做什么
>一个(!)线程读取文件并创建“作业”.每个工作都应该包含一个小的但不是太小的“工作单位”.将它们推入队列
>下一个线程等待队列中的作业并进行计算.这可能会发生在步骤#1中的线程等待慢硬盘返回新的数据行.此转换步骤的结果进入下一个队列
>通过JDBC上传数据的一个或多个线程.
第一个和最后一个线程相当慢,因为它们是I / O绑定(硬盘缓慢,网络连接更糟).加入数据库中的数据是一个非常复杂的任务(分配空间,更新索引,检查外键)
使用不同的工作线程可以提供很多优点:
>单独测试每个线程很容易.由于他们不共享数据,您不需要同步.队列会为你做这个>您可以快速更改每个步骤的线程数以调整性能