尼玛啊,网上找了半天,没找到斗破续集地址,只有一些部分的那种!我**啊,我要全集下载啊
虽然不提供全集下载,但是网上缺有提供在线阅读的地址,比如:http://www.66721.com/14/14800/
作为一名程序员,是将任何工作都要自动化的,于是乎,想法自然来了,我抓取这个页面的子链接,在抓取子链接里的内容就可以了
php实现具体代码:
$url='http://www.66721.com/14/14800';
$html=file_get_contents($url);
preg_match_all('/\<dd\>\<a\shref\=\"(\d{7}\.html)/',$html,$match);
$links=$match['1'];
$text='';
foreach($links as $key=>$vo){
$html=file_get_contents($url.'/'.$vo);
preg_match_all('/\<center\>\<span\sstyle\=\"font\-size\:15pt[\s\S]*?\<\/center\>([\s\S]*?)\<\/div\>/',$html,$match);
$text=$match['1']['0'];
$text=str_replace(' ','',strip_tags(iconv('gbk','utf-8',trim($match['1']['0']))));
$text=str_replace('?由提供在线文字版免费阅读(嗜血战刀全文阅读)。',"\n",$text);
file_put_contents('E:\\txt\\'.intval($key+1).'.txt',$text);
}
嘿嘿!记得php以cli模式来跑,不要用cgi,cgi会超时,当然,你set_time_limit(0)也可以,
截个图,表示我已经打包好了全部了
下载地址:http://download.csdn.net/detail/zouhao619/5257017