使用php采集网页内容

最新推荐文章于 2021-12-22 13:26:17 发布

fuguoda

最新推荐文章于 2021-12-22 13:26:17 发布

阅读量1.3k

点赞数

分类专栏： web前端 php 插件文章标签：自动采集

本文链接：https://blog.csdn.net/qq_40976560/article/details/91410117

版权

一、file_get_contents()获取网页

获取网页http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml全部内容

<?php 
	$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";
  	$html = file_get_contents($url);
  	//如果出现中文乱码使用下面代码
  	//$getcontent = iconv("gb2312", "utf-8",$html);
	echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";
?>

二、采集网页部分内容

$need=getNeedBetween($html, 'id="artibody"' , '<p class="article-editor">' );

内容中从字符串–id="artibody"开始截取
内容中从字符串-- < p class=“article-editor”>开始结束

	<?php
		$need=getNeedBetween($html, 'id="artibody"' , '&l

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

fuguoda

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
使用php采集网页内容

一、file_get_contents()获取网页获取网页http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml全部内容<?php $url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml"; $html = f...
复制链接

扫一扫