php 正则查找iframe,正则查找图片和iframe等内容的src值

最近后台很多视频的网站,需要用到优酷等的视频,怕客户不知道如何上传url,直接让他引入优酷下面分享的代码,我去获取src来获取视频地址!免得后面麻烦!

于是去研究了下正则,首先我们需要了解到的是几个函数!

1、match()如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本, match() 将返回 null。否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外,返回的数组还含有两个对象属性。index 属性声明的是匹配文本的起始字符在 stringObject 中的位置,input 属性声明的是对 stringObject 的引用。

举例:var str ='

';

var srcReg = /src=[\'\"]?([^\'\"]*)[\'\"]?/i;

var arr = str.match(srcReg);  // arr 为包含所有img标签的数组

我们会得到

e7b1468c83f2a23d64797cd87ecfb8fb.png

如果 regexp 具有标志 g,则 match() 方法将执行全局检索,找到 stringObject 中的所有匹配子字符串。若没有找到任何匹配的子串,则返回 null。如果找到了一个或多个匹配子串,则返回一个数组。不过全局匹配返回的数组的内容与前者大不相同,它的数组元素中存放的是 stringObject 中所有的匹配子串,而且也没有 index 属性或 input 属性。var str ='

';

var srcReg = /src=[\'\"]?([^\'\"]*)[\'\"]?/gi;

var arr = str.match(srcReg);  // arr 为包含所有img标签的数组

则会得到

6ff470a6cc7fff529ece3f7eb4bff1d6.png

2、js正则的写法

Javascript,它的正则规则patter写法是"/..../",所以不要问啥意思,他就这样定的!

3、正则结尾/i (忽略大小写)

/g (全文查找出现的所有匹配字符)

/m (多行查找)

/gi(全文查找、忽略大小写)

/ig(全文查找、忽略大小写)

/..../i

+ 表示一次或者多次

4、正则表达式

正则表达式的() [] {} 有着不同的意思。() 是为了提取匹配字符串的,表达式中有几个()就有几个相应的匹配字符串

(\s*)表示连续空格的字符串

[] 是定义匹配的字符范围。比如[a-zA-Z0-9]表示相应位置的字符要匹配英文字符和数字。[\s*表示空格或者*号]

{}一般是用来匹配的长度。比如\s{3}表示匹配三个空格,\s[1,3]表示匹配1到3个空格

(0-9)匹配'0-9'本身。[0-9]*匹配数字(注意后面有*,可以为空)[0-9]+匹配数字(注意后面有+,不可以为空),

{0-9}写法是错误的

[0-9]{0,9}表示长度为0到9的数字字符串。

5、^的意思

一般而言是限定开头的意思

但是当这个字符出现在一个字符集合模式的第一个字符时,他将会有不同的含义。【取反】

比如:/[^a-z\s]/会匹配"xhcss 3 admin"中的"3"这里的”^”的意思是字符类的否定,上面的正则表达式的意思是匹配不是(a到z和空白字符)的字符。

实验正则

好了! 那么接下来我们就来了解下正则怎么写!var str ='

';

我们看到上面的

那么我们正则首先匹配src/src/i

得到

e6142c1e8d00ccf0e32c54884186bd3b.png

匹配“,这里值得注意的是有时候是',所以我们需要匹配可能的2个值

我们的结构是src='(变量)' 因为我们需要获取src里面的值,所以中间需要设置成变量,这里不能用*匹配全部,及时后面匹配了‘结尾,因为后面还有好多'他会无限匹配!那么我们需要匹配的是 src=[冒号](非冒号的全部内容 并用()设置为变量)[冒号结尾]/src=[\'\"]?([^\'\"]*)[\'\"]?/i

这里需要注意的是/    不管它,原样显示

\    1个的话,原样显示

\\   2个的话,转义第2个\,只显示\

\\\  3个的话,第1个转义第2个,显示\,第3个\原样显示,也就是2和3的组合

\\\\ 4个的话,3和3的组合,显示\\,其他同理

\”  转义第2个”,显示”

? 表示出现0次或1次, 如\d?表示0个或一个数字

(*)表示中间所有内容

那么上面我的意思就是[\'\"]?  匹配第一个“

([^\'\"]*)  上面说到了^取反的意思 那么我们这个就是取反非‘和"的内容!

[\'\"]?  匹配结尾的“

我们输出试下console.log(arr[1]);

console.log(arr);

3f9607d25ab3f415a1cbcd92e417ffa9.png

而iframe则同理var str1 ="

2776cefb09f78534c6fb6444f04003fe.png

扩展:获取网页全部图片var imgReg = /|\/>)/gi;//获取全部图片

var srcReg = /src=[\'\"]?([^\'\"]*)[\'\"]?/i;//获取图片src

var arr = str.match(imgReg);  // arr 为包含所有img标签的数组

for (var i = 0; i 

var src = arr[i].match(srcReg);//获取图片地址

console.log('图片地址'+(i+1)+':'+src[1]);

}

原理就是上面的原理了!自行研究!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值