数据库存储_批量入库

最新推荐文章于 2022-09-14 20:17:00 发布

BTOM

最新推荐文章于 2022-09-14 20:17:00 发布

阅读量2.2k

点赞数

分类专栏：测试技术学习日记文章标签：数据库

学习日记同时被 2 个专栏收录

14 篇文章

订阅专栏

测试技术

8 篇文章

订阅专栏

这里是关于批量数据入库操作的疑问。

在java代码里我们一般都是用statement的executeBatch方法实现批量数据入库操作。

还有一种SQL方式：insert into test(id,name) values('1','Jerry'),('2','Tom'),.....('n','Neo');这样看来，只要拼接好一条SQL，通过statement的execute方法就能实现批量插入操作。但是一般平台开发都不会用这种方式。

请教下大家有没有研究过，这两种方式在数据中时怎么解析的？
batch操作，是不是就是将一批SQL同时提交给数据库，然后一条条执行？
而values方法，如果有多个()值，数据库又是怎么操作的？

总而言之，这两者的效率差别如何？
ps：自己做了些测试，但是随着批量操作的数据量不同，得到的耗时结果不一样，比较疑惑。

下面是论坛里搜到的问答：

解答一：

一般的数据库服务器的结构分为sql解析器和sql执行器。
请求到了服务器以后，首先要对sql做语法解析，检查有无错误，权限是否对等等等操作，然后再把编译好的指令发到执行器，由执行器来进行内存/硬盘io 对数据进行操作。

executeBatch省下的是数据库链接操作的时间，请求是批量提交到服务器的，经过解析器的解析之后，再逐条发送至执行器。

insert多个value，也不用取得很多次数据库链接（不论是创建还是池化），流程和以上一样，多个value我觉得应该是语法糖，执行器应该还是会逐条的处理。

以上分析建立在，执行器不能一次执行多条指令的基础上。这一块我确实没有深究过，如果有错误，希望大牛来指正。

LZ实测不同的效率来源，我觉得是，insert的静态语句会占用大量内存，这在数据膨胀的情况下应该还是会造成很大影响，如果是prepared的batch就不会有这个问题。

综上，还是batch比较好。

解答二：

在JDBC这，肯定是values多组值快了，都不需要控制事务，解析成sql，直接发给数据库就好了。
在数据库这里，语句的时间复杂度应该是一样的，那就是比jdbc拆sql快还是数据库拆sql快，从这点看，我猜values多组值快。
但不同数据库的特性是不一样的，比如oracle有共享sql，我不知道jdbc的实现能不能用的上，如果能batch会很快。