Mongodb操作里许多人喜欢采用PHP的循环操作,这种方式效率非常低下,可以优化。
1、 查询:
有两种方式,在PHP里循环查询和使用$in的方式。做一个查询1000条数据的示例如下:
运行时间:
0.15661716461182秒
结果采用循环方式的运行时间为$in方式的 3倍以上。
2、 更新:
还是两种方式,在PHP里循环更新和使用$in的方式。做一个查询1321条数据的示例如下:
运行时间:
28.02441906929秒
运行时间:
0.011945962905884秒
结果采用循环方式的运行时间为$in方式的 2335倍!
第一种方式非常容易出现运行的超时的情况造成操作不成功,而第二种方式在提高效率的同时避免了这种问题的出现。
造成这样问题的原因是1、循环里的网络请求时间消耗太多时间2、$in操作可以进行查询优化,也不需要多次编译。
1、 查询:
有两种方式,在PHP里循环查询和使用$in的方式。做一个查询1000条数据的示例如下:
- //循环查询
- for($i=0;$i<count($array);$i++){
- $item=$collection->findOne(array("_id"=>newMongoId($array[$i])));
- echo$item["profile"]["name"]."<br/>";
- }
运行时间:0.52035784721375秒
- //采用$in的方式
- $mongoIds=array();
- for($i=0;$i<count($array);$i++){
- $mongoIds[]=newMongoId($array[$i]);
- }
- $cursor=$collection->find(array("_id"=>array('$in'=>$mongoIds)));
- while($item=$cursor->getNext()){
- echo$item["profile"]["name"]."<br/>";
- }
结果采用循环方式的运行时间为$in方式的 3倍以上。
2、 更新:
还是两种方式,在PHP里循环更新和使用$in的方式。做一个查询1321条数据的示例如下:
- //循环更新(目前删除blog时采用的方式)
- foreach($fansas$fan)
- {
- $feed=$db->command(array("findAndModify"=>$MONGO_DB_FEED,
- "query"=>array('_id'=>newMongoId($fan)),
- "update"=>array('$pull'=>array("blogs"=>array("bid"=>$blog_id)),'$inc'=>array("count"=>-1)),
- "new"=>true
- )
- );
- }
- //采用$in的方式
- $mongoIds=array();
- foreach($fansas$fan){
- $mongoIds[]=newMongoId($fan);
- }
- $feed->update(array('_id'=>array('$in'=>$mongoIds)),array('$pull'=>array("blogs"=>array("bid"=>$blog_id)),'$inc'=>array("count"=>-1)),array('multiple'=>true));
结果采用循环方式的运行时间为$in方式的 2335倍!
第一种方式非常容易出现运行的超时的情况造成操作不成功,而第二种方式在提高效率的同时避免了这种问题的出现。
造成这样问题的原因是1、循环里的网络请求时间消耗太多时间2、$in操作可以进行查询优化,也不需要多次编译。