正则表达式例子:获得某个网页上的所有超链接

本文介绍了一个使用PHP编写的简单网页链接抓取程序。该程序允许用户输入一个URL地址,然后通过正则表达式匹配的方式从指定网页中提取所有链接,并显示在新的页面上。这有助于理解如何用PHP进行基本的网页爬虫开发。
摘要由CSDN通过智能技术生成

<html>
<head><title></title></head>
<body>
<a href="./">返回列表</a><br>
<form action="<?echo $PHP_SELF;?>" method="post">
URL:<input type="text" name="url" value="<?echo $url?>"><input type="submit" value="获取所有链接">
</form>
<?
if(isset($url)){
 echo "$url 有下列链接:<br>";
 $fcontents = file($url);
 
  while(list(,$line)=each($fcontents)){
   while(eregi('(href[[:space:]]*=[[:space:]]*"?[[:alnum:]:@/._-]+"?)(.*)',$line,$regs)){
    $regs[1] = eregi_replace('(href[[:space:]]*=[[:space:]]*"?)([[:alnum:]:@/._-]+)("?)',"//2",$regs[1]);
    echo "    $regs[1]<br>";
   $line = $regs[2];
   }
 }
}
?>
</body>
</html>

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值