php获取网站所有链接地址,php获取指定URL页面中的所有链接

今日给大伙儿共享一篇技术性文章内容,教大伙儿怎样在php中获得到特定URL网页页面中的全部连接,即全部a标签的href特性:

//获得连接的HTML编码

$html=file_get_contents('http://www.example.com');

$dom=newDOMDocument();

@$dom->loadHTML($html);

$xpath=newDOMXPath($dom);

$hrefs=$xpath->evaluate('/html/body//a');

for($i=0;$ilength;$i++){

$href=$hrefs->item($i);

$url=$href->getAttribute('href');

echo$url.'

';

}

这一段编码会获得到全部a标签的href特性,可是href特性值不一定是连接,我们可以在做下过虑,只保存http开始的连接详细地址:

//获得连接的HTML编码

$html=file_get_contents('http://www.example.com');

$dom=newDOMDocument();

@$dom->loadHTML($html);

$xpath=newDOMXPath($dom);

$hrefs=$xpath->evaluate('/html/body//a');

for($i=0;$ilength;$i++){

$href=$hrefs->item($i);

$url=$href->getAttribute('href');

//保存以http开始的连接

if(substr($url,0,4)=='http')

echo$url.'

';

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值