<html>
<head><title></title></head>
<body>
<a href="./">返回列表</a><br>
<form action="<?echo $PHP_SELF;?>" method="post">
URL:<input type="text" name="url" value="<?echo $url?>"><input type="submit" value="获取所有链接">
</form>
<?
if(isset($url)){
echo "$url 有下列链接:<br>";
$fcontents = file($url);
while(list(,$line)=each($fcontents)){
while(eregi('(href[[:space:]]*=[[:space:]]*"?[[:alnum:]:@/._-]+"?)(.*)',$line,$regs)){
$regs[1] = eregi_replace('(href[[:space:]]*=[[:space:]]*"?)([[:alnum:]:@/._-]+)("?)',"//2",$regs[1]);
echo " $regs[1]<br>";
$line = $regs[2];
}
}
}
?>
</body>
</html>
正则表达式例子:获得某个网页上的所有超链接
最新推荐文章于 2023-11-15 21:48:15 发布
本文介绍了一个使用PHP编写的简单网页链接抓取程序。该程序允许用户输入一个URL地址,然后通过正则表达式匹配的方式从指定网页中提取所有链接,并显示在新的页面上。这有助于理解如何用PHP进行基本的网页爬虫开发。
摘要由CSDN通过智能技术生成