同时提取多条新闻中的文本一例
更新时间:2006年10月09日 00:00:00 作者:
本文为一个提取一批新闻网页中的文本的小程序,它可以将各篇新闻的内容存为以该新闻标题为文件名的文本文件。如有更好的处理方法,请和我联系:
lwx3069@sina.com
这里以人民网中的“今日要闻”下的新闻为例.
($url) ? "" : $url = "http://www.unn.com.cn/GB/channel2/3/11/index.html"; // 今日要闻
if(isset($url)&&$url!="") {
$str = implode("",file($url));
$str_ary = explode("
- ",$str);
$str_ary = explode("
",trim($str_ary[1]));for ($i=0; $i<8; $i++) {
if (strlen(trim($str_ary[$i]))<3){
continue;
}
echo "新闻".$i.":".$str_ary[$i];
$url=substr("$str1",10,$len-10);
$url = "http://www.unn.com.cn/".$url;
define(CONTENTS_DIR,"./contents/");
$str = implode("",file($url));
',$str1[1]);
//取出文件的下半部分,并去掉没用的下半部分,这时得到的都是有用的
$str3=explode('',$str2[0]); //从整个有用部分取出文件标题和正文
$str5=explode('',$str3[1]); //从标题和正文部分取出标题
$title=str_replace("
","",$str5[0]);
$str3=explode('
',$str2[0]); //从整个有用部分取出文件正文
$str3[1]=str_replace('
',"\n"." ",$str3[1]);
$str3[1]=str_replace(' ',"",$str3[1]);
$str3=strip_tags($str3[1]);
$pf=trim($title).".txt";
$ppf=fopen(CONTENTS_DIR."$pf",'w');
fputs($ppf,$title);
fputs($ppf,"$str4[0]");
fputs($ppf,$str3);
}
}
}
}
?>
相关文章
PHP 5 数据对象 (PDO) 抽象层与 Oracle...2006-10-10
我们上面说过面向对象程序的单位就是对象,但对象又是通过类的实例化出来的,既然我们类会声明了,下一步就是实例化对象了。2009-09-09
今天小编就为大家分享一篇关于PHP的PDO错误与错误处理,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧2019-01-01
在PHP5类中继续使用cons修饰常量。我们使用const定义一个常量,定义的这个常量不能被改变。2010-05-05
PHP编程与应用...2006-10-10
总结了一个UTF-8的编码规则,根据这个编码规则,写一个UTF-8编码的解析程序,以下是PHP的实现,需要的朋友可以参考下2012-11-11
PHP新手上路(十二)...2006-10-10
杏林同学录(一)...2006-10-10
PHP调用三种数据库的方法(1)...2006-10-10
使用网络地址转换实现多服务器负载均衡...2006-10-10
最新评论