1、 查询:
有两种方式,在PHP里循环查询和使用$in的方式。做一个查询1000条数据的示例如下:
// 循环查询 for($i = 0; $i < count($array); $i++) { $item = $collection -> findOne(array("_id" => new MongoId($array[$i]))); echo $item["profile"]["name"] . "<br />"; }
运行时间:0.52035784721375秒
// 采用$in的方式 $mongoIds = array(); for($i = 0; $i < count($array); $i++) { $mongoIds[] = new MongoId($array[$i]); } $cursor = $collection -> find(array("_id" => array('$in' => $mongoIds))); while($item = $cursor-> getNext()){ echo $item["profile"]["name"] . "<br />"; }
运行时间: 0.15661716461182秒结果采用循环方式的运行时间为$in方式的 3倍以上。
2、 更新:
还是两种方式,在PHP里循环更新和使用$in的方式。做一个查询1321条数据的示例如下:
// 循环更新(目前删除blog时采用的方式) foreach ($fans as $fan) { $feed = $db -> command(array("findAndModify" => $MONGO_DB_FEED, "query" => array('_id' => new MongoId($fan)), "update" => array('$pull' => array("blogs"=>array("bid" => $blog_id)), '$inc' => array("count"=>-1)), "new" => true ) ); } 运行时间: 28.02441906929秒
// 采用$in的方式 $mongoIds = array(); foreach ($fans as $fan) { $mongoIds[] = new MongoId($fan); } $feed -> update(array('_id' => array('$in' => $mongoIds)), array('$pull' => array("blogs"=>array("bid" => $blog_id)), '$inc' => array("count" => -1)), array('multiple' => true)); 运行时间: 0.011945962905884秒
结果采用循环方式的运行时间为$in方式的 2335倍!
第一种方式非常容易出现运行的超时的情况造成操作不成功,而第二种方式在提高效率的同时避免了这种问题的出现。
造成这样问题的原因是1、循环里的网络请求时间消耗太多时间2、$in操作可以进行查询优化,也不需要多次编译。