CURL抓取网页内容并用正则提取。

原创 2013年01月14日 17:58:22
<?php
header("Content-Type:text/html;charset=UTF-8");
/*
 * CURL网页抓取
 * */
class Curl{
    var $setopt;
    var $data;
    function __construct($url){
        $this->setopt =array(
    CURLOPT_URL => "$url",
    CURLOPT_RETURNTRANSFER => true,
    CURLOPT_FOLLOWLOCATION => true,
);
    }
    function exec(){
        $ch = curl_init();
        curl_setopt_array($ch,$this->setopt);
        $this->data = curl_exec($ch);
        curl_close($ch);
        return $this->data;
    }
};
/*
 * 抓取回来的网页进行正则查找
 * id是按ID查找内容
 * tagName是标签查找
 * className按类名查找*/
class Preg{
    function id($data,$id){
        preg_match('/<(.*)\s*id=.*('.$id.').*>\s*(.*)\s*<\/(.*)>/',$data,$str);
        return $str[0];
    }
    
    function tagName($data,$tag){
        preg_match('/<'.$tag.'.*>\s*(.*)\s*<\/'.$tag.'>/',$data,$str);
        return $str[1];
    }
    
    function className($data,$class){
        preg_match('/<(.*)\s*class=.*('.$class.').*>\s*(.*)\s*<\/(.*)>/',$data,$str);
        return $str[0];
    }
    
}

$c = new Curl('www.corker.cc');
$data = $c->exec();
$data = @iconv("gb2312", "utf-8",$data);
$preg = new Preg();
echo $preg->tagName($data,'title');

?>

Servlet 和 XML

对 Java 程序员来说,Servlet 和 XML 是最令人振奋的两项技术。本文是为 2000 年 2 月 17 日旧金山 City Java 用户组准备的演示文稿。在本文中您将看到如何使用 ser...
  • wxyxl
  • wxyxl
  • 2001-05-04 13:40:00
  • 743

(PHP)用cURL抓取网页信息并替换部分内容

  • qq_16542775
  • qq_16542775
  • 2015-11-12 17:24:56
  • 3214

curl 和正则采集网页

效果展示: 采集分类 代码实现:       
  • woshihaiyong168
  • woshihaiyong168
  • 2016-11-30 11:23:13
  • 873

PHP cURL库函数抓取页面内容

cURL 是一个利用URL语法规定来传输文件和数据的工具,支持很多协议和选项,如HTTP、FTP、TELNET等,能提供 URL 请求相关的各种细节信息。最爽的是,PHP 也支持 cURL 库。 ...
  • chengshaolei2012
  • chengshaolei2012
  • 2017-05-24 12:10:00
  • 4201

使用 CURL+正则匹配获取网页信息

思路: 首先用CURL一套操作获取网页所有内容,之后用正则去匹配对应页面上的html标签。 以下是简单的实现,没写类。上传这篇文章仅供学习记录。//调用例子 date_default_ti...
  • userName222
  • userName222
  • 2017-10-24 17:33:36
  • 684

PHP扩展curl和正则表达式轻松采集新闻

PHP扩展curl和正则表达式轻松采集新闻
  • samxx8
  • samxx8
  • 2011-03-12 12:43:00
  • 5049

使用curl模拟登陆抓取网页指定内容

步骤: 1、获取要提交的表单元素 通过审查元素等工具,录一下登陆的过程,获取表单元素。当然也可以通过查看源代码找到需要提交的表单元素。 2、设置curl参数 知识点: 1、curl的使用 2、验证...
  • wzxsjdt
  • wzxsjdt
  • 2016-01-09 10:26:30
  • 3117

curl 获取需要授权页面的方法

  • 2015年03月20日 00:46
  • 1KB
  • 下载

使用cURL获取网页内容

cURL可以使用URL的语法模拟浏览器来传输数据,   因为它是模拟浏览器,因此它同样支持多种协议,   FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DIC...
  • wlzx120
  • wlzx120
  • 2015-09-18 10:59:53
  • 9723

如何使用curl获取网页内容

HttpRequest.class.php /*  * 使用curl扩展发出http的get或post请求  */ class HttpRequest {     //...
  • hhjianlong
  • hhjianlong
  • 2017-07-18 19:18:31
  • 828
收藏助手
不良信息举报
您举报文章:CURL抓取网页内容并用正则提取。
举报原因:
原因补充:

(最多只允许输入30个字)