关于在数据量比较大的时候进行插入或更新操作的问题

8 篇文章 0 订阅
2 篇文章 0 订阅

背景

最近需要每天从A库拉取5W+数据,然后需要插入B库,而且插入的过程,要先判断是否需要插入,判断后再进行插入或更新操作。

问题

如果每条数据都要先进行数据库查询看库中有没有数据再进行更新或插入操作,就会多出5W+的查询操作,每次又涉及到数据库连接的断开和连接,这样就导致性能的下降和时间的提高。

解决办法

使用 ON DUPLICATE KEY UPDATE 可解决此问题,将判断逻辑交由数据库去处理,而只需一次连接便可完成原先两次连接的操作。

举一反三

由于之前没用过这个语句,我也不知道有这种语句存在,在没有过来人指点的情况下,自己怎么样发现这个语句呢?一是平时的积累(看书,逛博,逛官方文档等),二是自己使用过类型的功能要能够进行联想,我就拿发现这个语句的思路举个例子。
我之前用过 insert ignore into ,于是联想到update操作会不会也有 类似(其实现在想想,这就是联想啦,遇到问题先想想自己有没有遇到类似的为题)的?于是顺腾摸瓜查找下去,就找到了这个 on duplicate

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
java导入excel大量数据出现内存溢出的问题可以通过以下几种方法来解决: 1. 分批导入:将大量数据分成多个小批次导入,每次只处理一部分数据,避免一次性加载全部数据导致内存溢出。可以按照行或者列进行分批导入,读取一部分数据后进行处理,然后再读取下一部分数据。 2. 内存优化:在导入数据时,可以优化内存使用,减少内存消耗。例如,使用SXSSF模式代替XSSF模式,SXSSF模式可以将Excel数据写入临时文件而不是全部加载到内存中,减少内存压力。 3. 限制每次读取的数据量:可以通过设置读取数据的行数或者列数限制来减少内存使用。例如,使用Apache POI库的setReadWindow方法来限制每次读取的行数和列数。 4. 增加JVM内存:通过增加JVM的内存限制来避免内存溢出问题。可以通过调整-Xms和-Xmx参数来增加JVM的初始内存和最大内存限制。 5. 优化代码逻辑:检查和优化导入数据的代码逻辑,确保没有内存泄漏或者无用的数据加载。可以使用工具来进行代码分析,找出潜在的问题进行优化。 6. 使用缓存机制:对于重复的数据,可以使用缓存机制来减少重复加载。可以将已经读取的数据缓存起来,在需要的时候直接从缓存中获取,避免重复读取导致的内存占用过高。 7. 使用数据库存储:对于大量数据的导入,可以考虑将数据存储在数据库中,而不是全部加载到内存中。可以使用数据库的批量插入操作来提高导入效率。 综上所述,解决java导入excel大量数据出现内存溢出问题可以通过分批导入、内存优化、限制每次读取的数据量、增加JVM内存、优化代码逻辑、使用缓存机制以及使用数据库存储等方法来实现。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值