PHP读取某站点的链接

原创 2002年05月21日 09:57:00

原理:读取某站点的源文件,再利用正则分析其源代码,得到所有链接
<?
/**********qiushuiwuhen(2002-5-20)***********/
if(empty($url))$url = "http://www.csdn.net/expert/";//设置url
$site=substr($url,0,strpos($url,"/",8));//站点
$base=substr($url,0,strrpos($url,"/")+1);//文件所在目录

$fp = fopen($url, "r" );//打开url
while(!feof($fp))$contents.=fread($fp,1024);//

$pattern="|href=['/"]?([^ '/"]+)['/" ]|U";
preg_match_all($pattern,$contents, $regArr, PREG_SET_ORDER);//匹配所有href=
for($i=0;$i<count($regArr);$i++){//遍历所有匹配
if(!eregi("://",$regArr[$i][1]))//是否是相对路径,即是否还有://
 if(substr($regArr[$i][1],0,1)=="/")//是否是站点的根目录
  echo "link".($i+1).":".$site.$regArr[$i][1]."<br/>";//根目录
 else
  echo "link".($i+1).":".$base.$regArr[$i][1]."<br/>";//当前目录
else
 echo "link".($i+1).":".$regArr[$i][1]."<br/>";//相对路径
}
fclose($fp);
?>

php远程抓取网站图片并保存

  • china_skag
  • china_skag
  • 2014年01月18日 16:10
  • 9303

php根据URL获得网页内容

php 函数获取网页内容
  • fujiafeihudui
  • fujiafeihudui
  • 2014年07月29日 20:56
  • 16804

Python 爬虫笔记(获取整个站点中的所有外部链接)

#! /usr/bin/env python #coding=utf-8import urllib2 from bs4 import BeautifulSoup import re impo...
  • qq_16103331
  • qq_16103331
  • 2016年09月28日 14:59
  • 1410

js 实现 检测站点的链接速度

  • 2010年03月31日 11:43
  • 1KB
  • 下载

恐龙站点文件链接系统

  • 2004年08月23日 15:36
  • 140KB
  • 下载

如何提高站点的链接流行度

  • 2009年06月24日 22:51
  • 7KB
  • 下载

给你的WordPress站点建立个性化的友情链接页面

(注意!!wordpress在12.12日进行了重大的升级,版本更新至3.5“Elvin”,之后没有链接管理功能,需要安装个插件Link Manager) 最近听到有人说,wordpress站点和别的...
  • lizhi125
  • lizhi125
  • 2013年11月10日 14:46
  • 1580

phpcms-v9.6.0网站迁移后,后台站点首页链接不能更新

我提到的就是上图画线圈。 提示:着急寻求解决方法的请移步到文章尾描述:按照phpcmsv9手册里的方法迁移网站并更新后,发现站点首页链接依旧无法更新 错误思路1:到admin模块下的后台模板查看站...
  • anyux
  • anyux
  • 2017年02月23日 21:58
  • 149

【计算机视觉】<资料站点>计算机视觉、模式识别、机器学习常用牛人主页链接

计算机视觉、模式识别、机器学习常用牛人主页链接     牛人主页(主页有很多论文代码) Serge Belongie at UC San Diego Antonio...
  • LG1259156776
  • LG1259156776
  • 2016年09月11日 17:09
  • 789

Shell 命令行实现将一个站点页面全部下载到本地并替换其中链接的脚本

Shell 命令行实现将一个站点页面全部下载到本地并替换其中链接的脚本不知道为什么,我总想用 Shell 脚本来实现把一个站点内容给下载下来。但是下载什么站点我确不知道。今天尝试了一下利用 curl ...
  • FungLeo
  • FungLeo
  • 2017年08月04日 15:14
  • 1112
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:PHP读取某站点的链接
举报原因:
原因补充:

(最多只允许输入30个字)