php正则实例,PHP正则表达式实例 源代码

1 使用正则表达式来检测HTML 是否关闭

代码片段

PHP代码

01.function check_html($html) {

02.preg_match_all("/]*>/",$html,$start_tags);

03.preg_match_all("//", $html, $end_tags);

04.if(count($start_tags[1]) != count($end_tags[1])) return false;

05.for($i = 0; $i < count($start_tags[1]); $i++) {

06.if(!in_array($start_tags[1][$i], $end_tags[1])) return false;

07.}

08.return true;

09.}

解释:

/]*>/这个模式是用来匹配HTML 的标记(如:

等等,但是除了
这种)的,并且在$start_tags 保持着标签

的名字(如:head、div 等)。而//这个模式是用来匹配闭合的HTML

标记(如:,

等)的。并且在$end_tags 中保持这闭合的标签名。然后我们用

count($start_tags[1]) != count($end_tags[1])这个条件语句来判断开始的标记跟闭合的

标记是否相等,不相等就说明没闭合。最后用in_array($start_tags[1][$i], $end_tags[1])

来判断开始标跟闭合的标记是否相等。至此,我们就完成了HTML 的匹配了!

2 匹配E-mail 格式

代码片段

PHP代码

01.function check_email($email) {

02.if(preg_match("/^[\w\d!#$%&'*+-\/=?^`{|}~]+(\.[\w\d!#$%&'*+-\/=?^`{|}~]+)*@([a-z\d][-a-z\

03.d]*[a-z\d]\.)+[a-z][-a-z\d]*[a-z]$/", $eamil)) return true;

04.return false;

05.}

解释:

不要被

/^[\w\d!#$%&'*+-\/=?^`{|}~]+(\.[\w\d!#$%&'*+-\/=?^`{|}~]+)*@([a-z\d][-a-z\d]*[az\

d]\.)+[a-z][-a-z\d]*[a-z]$/

这条模式给吓跑了, 其实也很简单的。前部分

[\w\d!#$%&'*+-\/=?^`{|}~]+(\.[\w\d!#$%&'*+-\/=?^`{|}~]+)*只是匹配符合RFC-2882 标

准的E-mail 地址允许出现的字符,就是英文字母,数字跟一些符号,有兴趣可以查询

RFC-2882 手册,而([a-z\d][-a-z\d]*[a-z\d]\.)+就是匹配HOST 的。最后[a-z][-a-z\d]*[a-z]

就是匹配顶级域名的(如:.com、.org)。

3 非贪心模式

有时候使用正则表达式的时候,你会发现有以下的问题:

代码片段

PHP代码

01.preg_match('/".*"/', 'Tony say:"hello", Jack say: "Hi"', $matches);

02.print_r($matches);

很惊奇的你会发现匹配的是这样的内容"hello", Jack say: "Hi",而不是"hello"和

"Hi"。这就是贪心匹配引起的。在贪心匹配中,正则表达式会尽可能的匹配最多的字

符,所以出现了第一种情况,但是我们想要的是第二种情况,那我们要怎么做呢?

我们可以使用非贪心匹配,将刚才的模式改为/".*?"/这样就可以看见我们想要的

结果了。*?这个就是非贪心匹配模式。还有另外一种就是+?。

 *?:前面的字符可以出现任意多次,但是遇到*?后的一个字符即停止匹配。

 +?:前面的字符可以出现一次或者多次,但是遇到+?后的一个字符即停止匹

配。

4 检测一个用户密码是否安全

代码片段

PHP代码

01.function is_good_pw($pw) {

02.if(preg_match('/(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z]).{8,16}/', $pw)) {

03.return true;

04.}

05.return false;

06.}

解释:

在本例中,我们使用了/(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z]).{8,16}/模式来匹配我们的

密码。在这个模式中,我们使用了正则表达式中的前瞻模式(?=)。(?=.*[0-9])这个是匹

配密码中有数字,而(?=.*[a-z])是匹配密码中有小写字母,最后(?=.*[A-Z])就是匹配密

码中有大写字母。而.{8,16}这个就是匹配密码是由8 至16 个字符组成的。那么我们

的密码就需要有数字,大写字母和小写字母组成的就属于安全的密码了~

5 匹配一个网站中的所有链接

代码片段

PHP代码

01.function get_links($link) {

02.$html = file_get_contents($link);

03.$html = str_replace("\n", "", $html);

04.$html = preg_replace('/

05.$html = preg_replace('//', "

\n", $html);

06.preg_match_all('/.*?/', $html, $matches);

07.return($matches);

08.}

在这个例子中,我们想用file_get_contents 来取得一个网页的内容。然后用

str_replace("\n", "", $html)把所有的换行去掉。再用preg_replace('/

preg_replace('//', "

\n", $html)来把所有的 .....模式另起一行。

最后就用preg_match_all('/.*?/', $html, $matches) 匹配链接模式。

/.*?/就是匹配.....这种模式的正则表达式。那我们为什

么要把.....链接另起一行呢??因为在/.*?/模式中,.*

是不能匹配换行的,所以就如和不在同一行就不能匹配了!!所以我们要这样

做!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值