正则表达式
一,简述
正则表达式:符合一定规则的表达式。
作用:用于专门操作字符串。
特点:用于一些特定的符号来表示一些代码操作。这样就简化书写。
所以学习正则表达式,就是在学习一些特殊符号的使用。
好处:可以简化对字符串的复杂操作。
弊端:符号定义越多,正则越长,阅读性越差。
二、功能
1,匹配:String matches方法。用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false。
2,切割:String split();
public static void sliptt(String s,String regex)
{
String[] arr=s.split(regex);
for(String ss:arr)
sop(ss);
}
3,替换:String replaceAll(regex,str);如果regex中有定义组,可以在第二参数中通过$符号获取正则表达式中的已有的组。
//需求:将口痴语句变正常
//使用替换功能
public static void change()
{
String s="我我我...我我.我...要要要....要...学java!";
String ss=s.replaceAll("\\.+","");
String sss=ss.replaceAll("(.)\\1+","$1");
sop(sss);
<pre name="code" class="java">public static void replace(String s,String reg, String newS)
{
String ss=s.replaceAll(reg,newS);
sop(ss);
}
public static void sop(Object o)
{
System.out.println(o);
}
<span style="white-space:pre"> </span>
4,获取:取出符合规则的字串。
操作步骤:
(1)将正则表达式封装成对象;p=Pattern.compile(reg)
(2)让正则对象和要操作的字符串想关联;Matcherm=p.matcher(str)
(3)获取正则匹配matcher;
(4)while(m.find())
m.group();
//获取
public static void get()
{
String s="sas dads dsdsd ffg rwe fgd ff jkj jkhj";
//1,封装正则对象
String reg="\\b\\w{4}\\b";//正则中都使用\\
Pattern p=Pattern.compile(reg);
//2,获得匹配器
Matcher m=p.matcher(s);
//3,细节操作
while(m.find())
{
sop(m.group());
}
}
三,四种功能如何选用
思路:
1,如果只想知道字符对错,使用匹配;
2,将已有字符串变成另外一个,替换;
3,想要按照自定的方式将字符串变成多个,切割;获取规则以外的;
4,想要拿到符合需求的字符串字串,获取;获取符合规则的;
四、案例
1、邮件匹配
//邮件匹配
public static void mailTo()
{
String s="zhuyutao@126.com.cn.cn.cn";
boolean b=s.matches("\\w+@\\w+(\\.\\w+){1,3}");
sop(b);
}
2、网页爬虫
:分析页面,获取自己想要的内容。
public static void spiders()throws Exception
{
String urlStr="http://blog.sina.com.cn/s/blog_61bdcb7e0101692h.html";
URL url=new URL(urlStr);
URLConnection conn=url.openConnection();
BufferedReader br=new BufferedReader(new InputStreamReader(conn.getInputStream()));
String line=null;
while((line=br.readLine())!=null)
{
//sop(line);
//获取pattern matcher
String mailReg="\\w+@\\w+(\\.\\w+)+";
Pattern p=Pattern.compile(mailReg);
Matcher m=p.matcher(line);
while(m.find())
sop(m.group());
}
}
------Java培训、Android培训、iOS培训、.Net培训、期待与您交流! -------