PHP获取目标网址标题、关键字、描述和其它meta信息的完美解决方法

最近研究了一下网址目录网站,里面全部都有一个输入网址后点击抓取Meta按钮就可以一键把目标网址的标题,关键字和描述信息抓取过来,非常方便。

其实原理非常简单就是使用了一个PHP的get_meta_tags函数。

但是老蔡发现很多网站都做的不是十分完美,可能是建站时间较早的原因。有些不填http就获取不到,有的必须填写完整网址,有的只能获取http不能获取https。

经过测试,下面提供一个非常完美的解决方案。通过判断可以获取所有的情况。

/**
*根据网址获取网站信息
*/
public function getWebInfo($siteurl){
  $preg = "/^http(s)?:\\/\\/.+/";  //正则表达式,判断输入的网址中是否包含http或https
  if(preg_match($preg,$siteurl))
  {
    //如果包含则直接返回获取到的meta信息
    return json_encode(get_meta_tags($siteurl));
  }else{
    //如果不包含
    if(get_meta_tags('http://'.$siteurl)){
      //先获取http的,如果获取到则直接返回
      return json_encode(get_meta_tags('http://'.$siteurl));
    }else{
      //否则就获取https的。
      return json_encode(get_meta_tags('https://'.$siteurl));
    }
  }

}

需要注意的一点是:在本地测试过程中,刚开始的时候https的根本就获取不到&

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值