PHP与正则表达式 | 黄乔国PHP

一、内容要点
     正则的概念
     PHP中常用正则相关函数
     正则表达式语法
     正则表达式工具类
二、概念
     外表风骚,内功深厚
     正则表达式是一种字符串搜索和匹配的工具。


三、PHP中常用的正则表达式函数
     preg_match($pattern,$subject);//表单验证
     preg_match_all($pattern,$subject,array &matches);
     preg_replace($pattern,$replacement,$subject);//过滤非法词语
     preg_filter($pattern,$replacement,$subject);
     preg_grep($pattern,$subject);
     preg_split($pattern,$subject);
     preg_quote($str);


     $pattern:正则表达式
     $subject:匹配的目标数据


3.1 preg_math()与preg_match_all()
     preg_match($pattern,$subject,[array &$matchs]);只匹配一次
     preg_match_all($pattern,$subject,array &$matchs);完全匹配
     两则都会将匹配结果放入$matchs数组中

     返回值return  匹配到结果的次数

 $pattern = '/[0-9]/';
 $subject = 'sdfa32dsfa23435ssdfdf';

 $m1 = $m2 = array();

 $r1 = preg_match($pattern,$subject,$m1);
 $r2 = preg_match_all($pattern,$subject,$m2);

 print_r($r1.'--'.$m1);
 echo '<h1/>'
 print_r($r2.'--'.$m2);

3.2 preg_replace()与preg_filter()
     preg_replace($pattern,$replacement,$subject);
     preg_filter($pattern,$replacement,$subject);

     功能一致,只是返回值不一样
     preg_replace会保留没有匹配的字符串
     preg_filter不回保留没有匹配的字符串

$pattern = ['/[01234]/','/[567]/','/[89]/'];
     $subject = ['sfsf','3af4','s','ff556'];
     $replacement = ['PHP','最',‘牛逼’];

     $r1 = preg_replace($pattern,$replacement,$subject);
     $r2 = preg_filter($pattern,$replacement,$subject);

     print_r($r1);
     echo '<hr/>';
     print_r($r2);

3.3 preg_grep()
      preg_grep($pattern,$subject);

      阉割版的preg_filter
      该函数不做替换,只做匹配
      返回值是匹配到的字符串

$pattern = '/[0-9]/';
     $subject = ['sfsf','3af4','s','ff556'];

     $arr = preg_grep($pattern,$subject);

     print_r($arr);

3.4 preg_split
      preg_split($pattern,$subject);

      利用$pattern 匹配到的字符串作为分隔符 将$subject分割成数组并返回
      可以看作是explode的高级版

$pattern = '/[0-9]/';
     $subject = 'php5是2世界上4最好2的3语言';

     $arr = preg_split($pattern,$subject);

     print_r($arr);

3.5 preg_quote
      preg_quote($str);

      将$str中的正则表达式转义
     如.\+*?[^]$(){}=!<>|:-等等都会加上反斜杠

$str = 'php\w+世界上[1234]{2}';

     $str = preg_quote($str);

     print_r($str);

四、正则表达式语法

-  界定符
-  原子
-  量词
-  边界控制
-  模式单元

4.1 界定符
     表示一个正则表达式的开始和结束
     /正则表达式/
     #正则表达 式 #
     {正则表达}

     为了不引起歧义不建议使用大括号,建议使用斜杠或者#

4.2 正则表达式工具
     regexpal
     在线版:http://regexpal.isbadguy.com/

4.3 原子性
     原子是正则表达式中最小的匹配单位
     包括可见原子和不可见原子

     可见原子--unicode编码表中用键盘输出后肉眼可见的字符
     包括:
          -标点;"_?.等等
          -英文字母数字 a-z,A-Z,0-9
          -汉子、日文、阿拉伯文等其他语言文字
          -数理化公式符号
          -其他可见字符

     不可见原子--unicode编码表中用键盘输出后肉眼不可见的字符
     包括:
          -换行符 \n
          -回车 \r
          -制表符 \t
          -空格
          -其他不可见字符
          注意:涉及到中文的匹配一定要将中文转换成unicode编码再写入正则表达式中去
               如何转换?找在线转换工具
              如果匹配的符号是正则的运算符,那么需要加上转义符 \

4.4 元字符
     ①定义原子的筛选方式
          | 匹配两个或多个分支选择
          []  匹配方括号中的任意一个原子
          [^] 匹配除方括号中的原子之外的任意字符
     ②定义原子的集合
          . 匹配除换行符之外的任意字符
          \d 匹配任意一个十进制数字 即[0-9]
          \D 匹配任意一个非十进制数字 即 [^0-9]
          \s 匹配一个不看见原子 即 [\f\n\r\t\v]
          \S 匹配一个可见原子 即 [^\f\n\r\t\v]
          \w 匹配任意一个数字字母下划线 即 [0-9a-zA-Z_]
          \W 匹配任意一个非数字字母下划线 即 [^0-9a-zA-Z_]

4.5 量词
     {n} 原子恰好出现n次
     {n,} 原子最少出现n次
     {n,m} 原子最少出现n次,最多出现m次
      * 匹配0次或者多次 即{0,}
     + 匹配一次或者多次 即{1,}
     ? 匹配0次或者1次 即 {0,1}

4.6 边界控制与模式单元
     ^ 匹配字符串开始位置
     $ 匹配字符串结尾位置
     () 匹配其中的整体为一个原子


4.7 修正模式
        贪梦模式
          匹配结果存在歧义时取其长
        懒惰模式
          匹配结果存在歧义时取其短

//$pattern = '/php.+123/';//默认是贪梦模式
      $pattern = '/php.+123/U';//加上U则是懒惰模式
     $subject = 'php___123123123123';
     $matchs = [];
     preg_match($pattern,$subject,$matchs);

     print_r($arr);
常见修正模式:
          U/u--懒惰匹配/贪梦匹配
          i  --忽略引文字母大小写
          x --忽略空白
          s --让元字符' . '匹配包括换行符在内的所有字符
          e --

五、常见正则的书写
     非空: /.+/
     2位浮点数: /\d+\.\d{2}$/
     手机号:/^1[34578]\d{9}$/
     email: /^\w+(\.\w+)*@\w+(\.\w+)+$/

六、正则工具类


<?php

class regexTool {
//自带的一些正则表达式
private $validate = array(
'require' => '/.+/',
'email' => '/^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/',
'url' => '/^http(s?):\/\/(?:[A-za-z0-9-]+\.)+[A-za-z]{2,4}(?:[\/\?#][\/=\?%\-&~`@[\]\':+!\.#\w]*)?$/',
'currency' => '/^\d+(\.\d+)?$/',//货币
'number' => '/^\d+$/',
'zip' => '/^\d{6}$/',
'integer' => '/^[-\+]?\d+$/',
'double' => '/^[-\+]?\d+(\.\d+)?$/',
'english' => '/^[A-Za-z]+$/',
'qq' => '/^\d{5,11}$/',
'mobile' => '/^1(3|4|5|7|8)\d{9}$/',
);
private $returnMatchResult = false;//是否返回结果
private $fixMode = null;//修正模式
private $matches = array();//匹配的结果数组
private $isMatch = false;//是否匹配

/**
* [__construct 构造方法]
* @Author Teacher黄
* @DateTime 2017-09-09T22:58:36+0800
* @param boolean $returnMatchResult [是否返回结果]
* @param [type] $fixMode [修正模式]
*/
public function __construct($returnMatchResult = false, $fixMode = null) {
$this->returnMatchResult = $returnMatchResult;
$this->fixMode = $fixMode;
}
/**
* [regex 执行正则匹配的方法]
* @Author Teacher黄
* @DateTime 2017-09-09T22:59:22+0800
* @param [type] $pattern [正则表达式|关键字]
* @param [type] $subject [需要验证的字符串]
* @return [type] [根据相应的配置返回结果]
*/
private function regex($pattern, $subject) {
if(array_key_exists(strtolower($pattern), $this->validate))
$pattern = $this->validate[$pattern].$this->fixMode;
$this->returnMatchResult ?
preg_match_all($pattern, $subject, $this->matches) :
$this->isMatch = preg_match($pattern, $subject) === 1;
return $this->getRegexResult();
}

/**
* [getRegexResult 得到匹配结果的方法]
* @Author Teacher黄
* @DateTime 2017-09-09T23:00:39+0800
* @return [type] [根据相应的配置返回结果]
*/
private function getRegexResult() {
if($this->returnMatchResult) {
     return $this->matches;
} else {
     return $this->isMatch;
}
}
/**
* [toggleReturnType 切换返回结果的类型]
* @Author Teacher黄
* @DateTime 2017-09-09T23:01:14+0800
* @param [type] $bool [切换标记]
* @return [type] [description]
*/
public function toggleReturnType($bool = null) {
if(empty($bool)) {
     $this->returnMatchResult = !$this->returnMatchResult;
} else {
     $this->returnMatchResult = is_bool($bool) ? $bool : (bool)$bool;
}
}

/**
* [setFixMode 设置修正模式]
* @Author Teacher黄
* @DateTime 2017-09-09T23:02:25+0800
* @param [type] $fixMode [修正模式的值]
*/
public function setFixMode($fixMode) {
     $this->fixMode = $fixMode;
}

/**
* [noEmpty 是否位空]
* @Author Teacher黄
* @DateTime 2017-09-09T23:02:46+0800
* @param [type] $str [需要检测的字符串]
* @return [type] [description]
*/
public function noEmpty($str) {
     return $this->regex('require', $str);
}

/**
* [isEmail 是否时邮箱]
* @Author Teacher黄
* @DateTime 2017-09-09T23:03:29+0800
* @param [type] $email [邮箱字符串]
* @return boolean [description]
*/
public function isEmail($email) {
     return $this->regex('email', $email);
}
/**
* [isMobile 是否是手机号]
* @Author Teacher黄
* @DateTime 2017-09-09T23:04:02+0800
* @param [type] $mobile [description]
* @return boolean [description]
*/
public function isMobile($mobile) {
     return $this->regex('mobile', $mobile);
}

/**
* [check 检测的方法]
* @Author Teacher黄
* @DateTime 2017-09-09T23:04:17+0800
* @param [type] $pattern [正则表达式 | 关键字]
* @param [type] $subject [需检测的字符串]
* @return [type] [description]
*/
public function check($pattern, $subject) {
     return $this->regex($pattern, $subject);
}

}







评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Miracle_PHP|JAVA|安全

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值