PHP爬取网页内容

本文参考:php中文网   发布者: 零到壹度  原文地址:http://m.php.cn/article/392232.html

下面是我写的一个小的测试接口

http://47.107.148.116/antupapa.php?url=https://new.qq.com/omn/20181202/20181202A00I06.html

http://47.107.148.116/antupapa.php?url={你要爬的网页url}

PHP脚本代码如下:

<?php
  // 允许所有域访问
  header("Access-Control-Allow-Origin: *");
  $url =$_GET['url'];   
  $html = file_get_contents($url);
  preg_match("/<body[^>]*?>(.*\s*?)<\/body>/is",$html,$match1);//正则匹配body里面的内容
  echo $match1[0];//输出网页

注意,该接口已知问题 :在iPhone浏览器打开可能会出现文本不正确的情况。(如果在微信打开,点击访问原文则正常)

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值