PHP正则表达式通例范例

10 篇文章 0 订阅

        正则表达式regular expression,这里简称Regex,简而言之本质上是一种expression表达式。既是表达式,一般包含操作数和操作符。

         PHP的正则表达式regex由单引号或双引号加斜杠对称包含,即‘/[expression]/’或"/[expression]/",[expression]为自定义内容。基本用法:善用搜索引擎searching? engine,简称SE。各种search各种筛选的迭代。使用ASCII码字母字符来代表expression表达式中的字符模式。我们都知道,通用ASCII码是128个,是有序集合。所以从a到z可以写成[a-z],区分大小写是ASCII码表的基本常识。还有一些常规的缩写expression表达式,对于新手而言很有规范的。但是用到后面,发现有些对中文字符集,如GB2312、GBK和Big5里的中文字符匹配就不太友好friendly,甚至感到有点糟糕的体验experience。所以熟悉后建议使用ASCII码表和Unicode编码结合中文字符集自定义方为上策。

        以上皆为“废话”。

        随手写下此笔记是为记录自己技术道路的点滴...

        以下是一些自己的匹配通用expression表达式:

# 1)img标签source源,文件扩展名后缀为.jpg .jpeg .png .gif .webp .bmp的
$imgsrcpattern='/[^>\"\']+.jpg|[^>\"\']+.jpeg|[^>\"\']+.png|[^>\"\']+.gif|[^>\"\']+.webp|[^>\"\']+.bmp/';
# 2)超链接http(s)
$linksrcpattern='/http[s]?:\/\/[^>\"\']+/';
# 3)属性包含href的标签
$linktagpattern='/href=[\'"]{1}[^<>"\']+[\'"]{1}/';
# 4)文件扩展名后缀为.js
$jssrcpattern='/http[s]?:\/\/[^>\"\']+.js[^>\"\']*/';
# 5)img标签
$imgpattern='/<img[^>]*?>/';
# 6)img标签,包含alt属性
$altpattern='/<img[^>]*alt=[^>]+>/';
# 7)html头部的meta标签,包含属性为charset字符集
$mcharsetpattern='/<meta[^>]*charset=[^>]+>/';
# 8)属性为charset
$charsetpattern='/charset=[a-zA-Z0-9]+/';
# 9)html头部的title标签,即网页标题title
$titlepattern='/<title>[^>]*<\/title>/';
# 2019年10月23日 星期三 13:02 MRN
# 10)title标签内容,即标题内容
$titlesrcpattern='/[^<>]+/';
# 11)http(s) 响应response头信息:ETag,即包含文件名的ETag标签
$tagfilepattern='/ETag:[ ]*"[^<\"\']+"/';
# 12)响应response头信息的Content-Type信息
$contenttypepattern='/Content-Type:[ ]*[a-zA-Z0-9]+[\/][a-zA-Z0-9]+/';

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值