最近后台很多视频的网站,需要用到优酷等的视频,怕客户不知道如何上传url,直接让他引入优酷下面分享的代码,我去获取src来获取视频地址!免得后面麻烦!
于是去研究了下正则,首先我们需要了解到的是几个函数!
1、match()如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本, match() 将返回 null。否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外,返回的数组还含有两个对象属性。index 属性声明的是匹配文本的起始字符在 stringObject 中的位置,input 属性声明的是对 stringObject 的引用。
举例:var str ='
';var srcReg = /src=[\'\"]?([^\'\"]*)[\'\"]?/i;
var arr = str.match(srcReg); // arr 为包含所有img标签的数组
我们会得到
如果 regexp 具有标志 g,则 match() 方法将执行全局检索,找到 stringObject 中的所有匹配子字符串。若没有找到任何匹配的子串,则返回 null。如果找到了一个或多个匹配子串,则返回一个数组。不过全局匹配返回的数组的内容与前者大不相同,它的数组元素中存放的是 stringObject 中所有的匹配子串,而且也没有 index 属性或 input 属性。var str ='
';var srcReg = /src=[\'\"]?([^\'\"]*)[\'\"]?/gi;
var arr = str.match(srcReg); // arr 为包含所有img标签的数组
则会得到
2、js正则的写法
Javascript,它的正则规则patter写法是"/..../",所以不要问啥意思,他就这样定的!
3、正则结尾/i (忽略大小写)
/g (全文查找出现的所有匹配字符)
/m (多行查找)
/gi(全文查找、忽略大小写)
/ig(全文查找、忽略大小写)
/..../i
+ 表示一次或者多次
4、正则表达式
正则表达式的() [] {} 有着不同的意思。() 是为了提取匹配字符串的,表达式中有几个()就有几个相应的匹配字符串
(\s*)表示连续空格的字符串
[] 是定义匹配的字符范围。比如[a-zA-Z0-9]表示相应位置的字符要匹配英文字符和数字。[\s*表示空格或者*号]
{}一般是用来匹配的长度。比如\s{3}表示匹配三个空格,\s[1,3]表示匹配1到3个空格
(0-9)匹配'0-9'本身。[0-9]*匹配数字(注意后面有*,可以为空)[0-9]+匹配数字(注意后面有+,不可以为空),
{0-9}写法是错误的
[0-9]{0,9}表示长度为0到9的数字字符串。
5、^的意思
一般而言是限定开头的意思
但是当这个字符出现在一个字符集合模式的第一个字符时,他将会有不同的含义。【取反】
比如:/[^a-z\s]/会匹配"xhcss 3 admin"中的"3"这里的”^”的意思是字符类的否定,上面的正则表达式的意思是匹配不是(a到z和空白字符)的字符。
实验正则
好了! 那么接下来我们就来了解下正则怎么写!var str ='
';我们看到上面的
那么我们正则首先匹配src/src/i
得到
匹配“,这里值得注意的是有时候是',所以我们需要匹配可能的2个值
我们的结构是src='(变量)' 因为我们需要获取src里面的值,所以中间需要设置成变量,这里不能用*匹配全部,及时后面匹配了‘结尾,因为后面还有好多'他会无限匹配!那么我们需要匹配的是 src=[冒号](非冒号的全部内容 并用()设置为变量)[冒号结尾]/src=[\'\"]?([^\'\"]*)[\'\"]?/i
这里需要注意的是/ 不管它,原样显示
\ 1个的话,原样显示
\\ 2个的话,转义第2个\,只显示\
\\\ 3个的话,第1个转义第2个,显示\,第3个\原样显示,也就是2和3的组合
\\\\ 4个的话,3和3的组合,显示\\,其他同理
\” 转义第2个”,显示”
? 表示出现0次或1次, 如\d?表示0个或一个数字
(*)表示中间所有内容
那么上面我的意思就是[\'\"]? 匹配第一个“
([^\'\"]*) 上面说到了^取反的意思 那么我们这个就是取反非‘和"的内容!
[\'\"]? 匹配结尾的“
我们输出试下console.log(arr[1]);
console.log(arr);
而iframe则同理var str1 ="
扩展:获取网页全部图片var imgReg = /|\/>)/gi;//获取全部图片
var srcReg = /src=[\'\"]?([^\'\"]*)[\'\"]?/i;//获取图片src
var arr = str.match(imgReg); // arr 为包含所有img标签的数组
for (var i = 0; i
var src = arr[i].match(srcReg);//获取图片地址
console.log('图片地址'+(i+1)+':'+src[1]);
}
原理就是上面的原理了!自行研究!