php获取页面指定内容,php 获取页面中的指定内容类

功能:

1.获取内容中的url,email,image。

2.替换内容中的url,email,image。url:xxx

email:admin@admin.com

image:image

Grep.class.php<?php

/** grep class

* Date: 2013-06-15

* Author: fdipzone

* Ver: 1.0

*

* Func:

*

* set: 设置内容

* get: 返回指定的内容

* replace: 返回替换后的内容

* get_pattern 根据type返回pattern

*/

class Grep{ // class start

private $_pattern = array(

'url' => '/

'email' => '/([\w\-\.]+@[\w\-\.]+(\.\w+))/',

'image' => '//i'

);

private $_content = ''; // 源内容

/* 設置搜尋的內容

* @param String $content

*/

public function set($content=''){

$this->_content = $content;

}

/* 获取指定内容

* @param String $type

* @param int $unique 0:all 1:unique

* @return Array

*/

public function get($type='', $unique=0){

$type = strtolower($type);

if($this->_content=='' || !in_array($type, array_keys($this->_pattern))){

return array();

}

$pattern = $this->get_pattern($type); // 获取pattern

preg_match_all($pattern, $this->_content, $matches);

return isset($matches[1])? ( $unique==0? $matches[1] : array_unique($matches[1]) ) : array();

}

/* 获取替换后的内容

* @param String $type

* @param String $callback

* @return String

*/

public function replace($type='', $callback=''){

$type = strtolower($type);

if($this->_content=='' || !in_array($type, array_keys($this->_pattern)) || $callback==''){

return $this->_content;

}

$pattern = $this->get_pattern($type);

return preg_replace_callback($pattern, $callback, $this->_content);

}

/* 根据type获取pattern

* @param String $type

* @return String

*/

private function get_pattern($type){

return $this->_pattern[$type];

}

} // class end

?>

Demo

header('content-type:text/htm;charset=utf8');

require('Grep.class.php');

$content = file_get_contents('http://www.test.com/');

$obj = new Grep();

$obj->set($content);

$url = $obj->get('url', 0);

$email = $obj->get('email', 1);

$image = $obj->get('image', 1);

print_r($url);

print_r($email);

print_r($image);

$url_new = $obj->replace('url', 'replace_url');

echo $url_new;

function replace_url($matches){

return isset($matches[1])? '[url]'.$matches[1].'[/url]' : '';

}

?>

以上就是php 获取页面中的指定内容类的内容,更多相关内容请关注PHP中文网(www.php.cn)!

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值