今天给网站做一个视频白名单功能,需要用正则来解析出合法的视频URL,公司在网站上出现特定路径的动态视频。
做法:对于传进来的视频URL进行正则匹配,将符合要求的URL转化为html.不符合要求的地址进行过滤
对于如何写正则表达式,网上有一大堆,随便搜一下就可以了。
这里要讲的是如何将匹配到的合法地址取出来。
举个例子
//正则表达式
String reg = "(\\[flash\\]http:\\//(player.ku6.com|player.youku.com|www.tudou.com|v.ifeng.com|you.video.sina.com.cn){1}(.*?)\\[\\/flash\\])";
//被解析的字符串
String input = "[flash]http://www.tudou.com/l/MJfT9Na29ao/&iid=112276320/v.swf[/flash][flash]http://www.tudou.com/l/MJfT9Na29ao/&iid=112276320/v.swf[/flash][flash]http://www.rudou.com/l/MJfT9Na29ao/&iid=112276320/v.swf[/flash][flash]http://www.tudou.com/l/MJfT9Na29ao/&iid=112276320/v.swf[/flash]";
红色部分为合法的部分,需要被解析出来
java代码
public class RexExample{
public staic void main(String args[]){
Pattern pattern = Pattern.compile(reg);
Matcher matcher = pattern.matcher(input);
while(matcher.find()){//注意 ,需要有这个判断条件,之前没有用这个条件就直接group()老是获取不到
System.out.println(matcher.group());
}
}
}
正则还可以替换,当然就是用replaceAll("要替换过的字符串");
这里还有一个学习正则很不错的网址: http://edu.yesky.com/edupxpt/18/2143018.shtml