用正则表达式提取网页中的邮箱地址

  1. import java.io.BufferedReader;  
  2. import java.io.FileReader;  
  3. import java.io.IOException;  
  4. import java.util.regex.*;  
  5.   
  6.   
  7. public class MyRegex {  
  8.     public static void main(String[] args) {  
  9.           
  10.         try {  
  11.             //读取网页文件,里面有N个邮箱地址  
  12.             String content = read("e:/1.htm");//read()方法在下面  
  13.             //匹配邮箱的正则表达式  
  14.             String regex="//w+([-+.']//w+)*@//w+([-.]//w+)*//.//w+([-.]//w+)*";  
  15.             Matcher m=Pattern.compile(regex).matcher(content);  
  16.             while(m.find()){  
  17.                 //输出邮箱地址  
  18.                 System.out.println(m.group());  
  19.             }  
  20.         } catch (IOException e) {  
  21.             e.printStackTrace();  
  22.         }         
  23.     }  
  24.       
  25.     /** 
  26.      * 读取文本内容 
  27.      * @param fileName 文本名称,包括路径 
  28.      * @return 返回文本内容 
  29.      */  
  30.     public static String read(String fileName) throws IOException{  
  31.         BufferedReader br=new BufferedReader(new FileReader(fileName));  
  32.         StringBuilder sb=new StringBuilder();  
  33.         String s;  
  34.         while((s=br.readLine())!=null)  
  35.         {  
  36.             sb.append(s);  
  37.             sb.append("/r/n");  
  38.         }  
  39.         br.close();  
  40.         return sb.toString();  
  41.     }  
  42. }
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值