MongoDB学习笔记4 - MongoDB数据导入实验(mongoimport)

最新推荐文章于 2024-08-08 14:14:57 发布

li_yang98

最新推荐文章于 2024-08-08 14:14:57 发布

阅读量1.4w

点赞数

分类专栏： NoSQL 文章标签： mongodb csv insert mysql date 测试

本文链接：https://blog.csdn.net/li_yang98/article/details/6200079

版权

NoSQL 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

昨天比较了一下在某个特定应用中MongoDB和MySQL导入数据的性能，但是MongoDB的测试结果并不能令人满意，今天继续尝试了几种导入数据的方法，希望提升数据导入性能。

在昨天的实验中，是以id随机的顺序插入数据的，由于我们在id这个属性上面建立了递增索引，因此首先怀疑的是由于id无序造成后面插入的数据有可能导致前面已经插入的数据移动位置，所以第一个实验把插入顺序改成按id赠序。但结果没有什么变化，插入一百万条数据用了1422秒(比昨天按id随机顺序插入还慢了点，晕死...)。

进一步怀疑由于昨天的实验中建立的是unique index，导致每次调用update的时候都需要检查是否有重复索引重复。因此在第二个实验中去掉了索引unique的限制，改为inventory.create_index([('date',ASCENDING), ('id',ASCENDING)], unique=False, dropDups=False)。但仍然不起作用，插入一百万条数据还是用了1412秒。

索性把索引全部去掉，插入一百万条数据仍然用了1419秒。看来不是索引的问题，那么问题可能来自于一条一条插入数据，改成批量插入是否会好些呢？在后面的实验中，索引用非unique的形式inventory.create_index([('date',ASCENDING), ('id',ASCENDING)], unique=False, dropDups=False)，而数据插入则从昨天调用update改为调用insert，下面是不同batch size下的测试结果