PHP爬取网页内容

最新推荐文章于 2024-07-06 10:57:20 发布

antu58

最新推荐文章于 2024-07-06 10:57:20 发布

阅读量1.3k

点赞数

分类专栏： php 文章标签： PHP

php 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文参考：php中文网发布者：零到壹度原文地址：http://m.php.cn/article/392232.html

下面是我写的一个小的测试接口

http://47.107.148.116/antupapa.php?url=https://new.qq.com/omn/20181202/20181202A00I06.html

http://47.107.148.116/antupapa.php?url={你要爬的网页url}

PHP脚本代码如下：

<?php
  // 允许所有域访问
  header("Access-Control-Allow-Origin: *");
  $url =$_GET['url'];   
  $html = file_get_contents($url);
  preg_match("/<body[^>]*?>(.*\s*?)<\/body>/is",$html,$match1);//正则匹配body里面的内容
  echo $match1[0];//输出网页

注意，该接口已知问题：在iPhone浏览器打开可能会出现文本不正确的情况。（如果在微信打开，点击访问原文则正常）