之前有一次抓取x浪图片库的时候200w图片跑了一整天的时间,
后来采取多进程抓取提高了很高的效率。
多进程的实现可以参考这个方法:
http://blog.csdn.net/u014017080/article/details/46925725
主进程文件--调用子进程 每一个分类对应单独的一个进程 并发抓取
<?php
set_time_limit(0);
$arr = array(
// 7, //生活百科
// 6, //经典语录
// 3, //幽默搞笑
// 25, //创意无限
// 23, //萌宠动物
// 20, //心里测试
// 8, //时尚潮流
// 68, //内涵漫画
// 4, //星座物语
// 22, //时尚家居
// 17, //小说故事
// 5, //美食工厂
24, //生活百科
19, //经典语录
88, //幽默搞笑
57, //创意无限
1, //萌宠动物
2, //心里测试
43, //时尚潮流
32, //内涵漫画
97, //星座物语
);
foreach($arr as $v){
//echo '/usr/local/php/bin/php get_wbcontent_ppcc.php '.$v.' > /dev/null 2>&1 &'."\n";
exec('/usr/local/php/bin/php get_wbcontent_ppcc.php '.$v.' > /dev/null 2>&1 &');