PHP读取某站点的链接的函数

原创 2006年06月10日 11:35:00

原理:读取某站点的源文件,再利用正则分析其源代码,得到所有链接
<?
/**********qiushuiwuhen(2002-5-20)***********/
if(empty($url))$url = "http://www.csdn.net/expert/";//设置url
$site=substr($url,0,strpos($url,"/",8));//站点
$base=substr($url,0,strrpos($url,"/")+1);//文件所在目录

$fp = fopen($url, "r" );//打开url
while(!feof($fp))$contents.=fread($fp,1024);//

$pattern="|href=['"]?([^ '"]+)['" ]|U";
preg_match_all($pattern,$contents, $regArr, PREG_SET_ORDER);//匹配所有href=
for($i=0;$i<count($regArr);$i++){//遍历所有匹配
if(!eregi("://",$regArr[$i][1]))//是否是相对路径,即是否还有://
 if(substr($regArr[$i][1],0,1)=="/")//是否是站点的根目录
  echo "link".($i+1).":".$site.$regArr[$i][1]."<br/>";//根目录
 else
  echo "link".($i+1).":".$base.$regArr[$i][1]."<br/>";//当前目录
else
 echo "link".($i+1).":".$regArr[$i][1]."<br/>";//相对路径
}
fclose($fp);
?>

相关文章推荐

php curl函数请求链接获得结果

curl获取网页数据private function curl($url,$data=null,$method = null){ $ch=curl_init(); curl_setop...

js 实现 检测站点的链接速度

  • 2010年03月31日 11:43
  • 1KB
  • 下载

恐龙站点文件链接系统

  • 2004年08月23日 15:36
  • 140KB
  • 下载

一、功能简述 正是微博如火如荼的时节,其中各个微博的分享功能是网站推广产品的好东东啊,此时如何方便快捷的使用微博的分享功能就显得比较重要了。我的站点每篇文章的底部有一些分享的链接: 不过我觉得这些分享

一、功能简述 正是微博如火如荼的时节,其中各个微博的分享功能是网站推广产品的好东东啊,此时如何方便快捷的使用微博的分享功能就显得比较重要了。我的站点每篇文章的底部有一些分享的链接: 不过我觉得这些分享...
  • A_post
  • A_post
  • 2012年05月20日 11:45
  • 861

如何提高站点的链接流行度

  • 2009年06月24日 22:51
  • 7KB
  • 下载

Ubuntu Linux, Android 开发站点.资源.链接.博客, 环境配置

ibus-wubi输入法 特殊符号输入: zzbd 标点符号   zzpy 拼音符号   zzts 特殊符号   zzsx 数学符号    zzdx 单位符号   zzjt 箭头符号   zzys 圆...

[v9] v9站群模式下,子站点栏目和文章ur动态时l域名错误显示为主站链接的解决办法

本修改办法来自于txb2d(原帖见http://bbs.phpcms.cn/thread-669461-1-1.html)。之前看到很多人和本人一样,照着那方法修改之后,仍然不起作用,在世界首富和化蝶...

Shell 命令行实现将一个站点页面全部下载到本地并替换其中链接的脚本

Shell 命令行实现将一个站点页面全部下载到本地并替换其中链接的脚本不知道为什么,我总想用 Shell 脚本来实现把一个站点内容给下载下来。但是下载什么站点我确不知道。今天尝试了一下利用 curl ...
  • FungLeo
  • FungLeo
  • 2017年08月04日 15:14
  • 865

Python 爬虫笔记(获取整个站点中的所有外部链接)

#! /usr/bin/env python #coding=utf-8import urllib2 from bs4 import BeautifulSoup import re impo...

phpcms-v9.6.0网站迁移后,后台站点首页链接不能更新

我提到的就是上图画线圈。 提示:着急寻求解决方法的请移步到文章尾描述:按照phpcmsv9手册里的方法迁移网站并更新后,发现站点首页链接依旧无法更新 错误思路1:到admin模块下的后台模板查看站...
  • anyux
  • anyux
  • 2017年02月23日 21:58
  • 109
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:PHP读取某站点的链接的函数
举报原因:
原因补充:

(最多只允许输入30个字)