本人近期要处理一些文本(160w行),需要将文本中的所有网址都找出来,并写入到新的txt文件中。于是,本人问了身边的同学,决定使用正则表达式来找出网址。闲话不多说,直接上代码:
package UrlMatchTest1;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class test1 {
public static class MyMatch {
private String str;//目标字符串
private String regex;//正则表达式
public Pattern p;
public Matcher m;
public MyMatch() {
super();
}
public MyMatch(String str, String regex) {
this.str = str;
this.regex = regex;
Pattern p = Pattern.compile(this.regex, Pattern.CASE_INSENSITIVE);
m = p.matcher(this.str);//根据正则表达式,进行匹配(查找网址)
}
}
public static void main(String[] args) {
String regex = "(http)://t.cn