正则表达式
元字符
.表示出了\n以外的任意单个字符。例如:a.b能够进行匹配的有acb、a b、a3b、aab等等。
[]表示字符组中的任意一个字符。例如:[a-z]表示a到z中的任意一个字符。点在字符组中表示一个普通的点,不再表示一个元字符了。
|表示“或”的意思。例如:a(x|y)b表示a和b之间要么是x要么是y。“或”的优先级最低,所以z|food表示要么是z要么是food。
()表示“改变优先级”或者“提取组”
*是限定符,限定它前面的表达式出现的次数可以是零次或者多次。例如:a.*b能够匹配的有ab、axb、aaxb等等。
+是限定符,限定它前面的表达式出现的次数为至少一次。例如:a.+b能够匹配的有axb、axdb等等。
?是限定符,限定他前面的表达式出现的次数为零次或者一次。例如:a.?b能够匹配的有ab、axb、acb等等。?号还有另一个意思是“终止贪婪模式”。
{}表示限定符,{8}表示限定它前面的表达式出现的次数为8次,{2,8}表示至少出现2次,最多出现8次,{2,}表示最少出现2次,最多不限。
^的第一种表示意思是以什么开头,例如:^王..,这个能够匹配的有王健林、王小二等等。^的第二种意思是在字符组中取反,例如:a[^abc]b能够匹配的有axb、ayb、aub等等。
$表示以什么结尾,例如:oo$能够匹配的有zoo、too等等。
\d表示一个数字,等同于[0-9]。
\D表示的与\d相反。
\w表示匹配单个字母或数字或下划线或汉字。
\W表示的与\w相反。
\s表示空白字符,例如:空格、制表键、回车等等。
\S表示的与\s相反。
任意单个字符可以表示为:[\d\D]、[\s\S]、[\w\W]
正则表达式常用的方法
Regex.IsMatch()//用来判断给定的某个字符串是否匹配某个正则表达式
Regex.Match();//用来从给定的字符串中按照正则表达式的要求提取【一个】字符串
Regex.Matches();//用来从给定的字符串中按照正则表达式的要求提取【多个】字符串
Regex.Replace();//替换所有正则表达式匹配的字符串为另外一个字符串
正则表达式练习
//判断是否是合法的邮政编码
string postCode = "267389";
//想要完全匹配就得加起始和终止符号
bool b = Regex.IsMatch(postCode,"^[0-9]{6}$");
MessageBox.Show(b.ToString());
//判断10-25之间的任意一个数字
string num = "26";
bool b = Regex.IsMatch(num, "^(1[0-9]|2[0-5])$");
MessageBox.Show(b.ToString());
//验证是否为合法的手机号
string num = "15853882256";
//记得加@来取消转义
bool b = Regex.IsMatch(num, @"^\d{11}$");
MessageBox.Show(b.ToString());
//两种容易混淆的正则表达式
//"^z|food&"表示匹配以z开头或者以food结尾的。"^(z|food)$"表示匹配z或者food,并且以以z开头和结尾或者以food开头和结尾。
//判断输入的身份证号是否合法
string idNO = "37092319970902223X";
//身份证号:第一种:15位纯数字,首位不能为0. 第二种:18位,首位不能为0,前17位是数字,最后一位为数字或者x或者X.
bool b = Regex.IsMatch(idNO, "^([1-9][0-9]{14}([0-9]{2}[0-9xX])?)$");
MessageBox.Show(b.ToString());
//验证输入的邮箱是否是合法的
string email = "191asidjai_jia.com@qq.com.cn";
bool b = Regex.IsMatch(email, @"^[-0-9a-zA-Z_.]+@[0-9a-zA-Z]+([.][a-zA-Z]+)+$");
MessageBox.Show(b.ToString());
//判断正确的国内电话号码
string num = "0100-8888809";
bool b = Regex.IsMatch(num, @"^((\d{3,4}-?[0-9]{7,8})|[0-9]{5})$");
MessageBox.Show(b.ToString());
//判断ip地址是否合法
string ip = "192.168.1.1";
bool b = Regex.IsMatch(ip, "^[0-9]{1,3}([.][0-9]{1,3}){3}$");
MessageBox.Show(b.ToString());
//判断日期是否合法
string date = "2019-03-31";
bool b = Regex.IsMatch(date, "^[0-9]{4}-(0[0-9]|1[0-2])-[0-3][0-9]$");
MessageBox.Show(b.ToString());
正则表达式提取字符串
string str = "大家好呀,hello,2010年10月10日是个好日子。恩,9494。吼吼,886.";
//一般提取字符串不加^和$
//match()方法只能提取一个匹配
Match match = Regex.Match(str, "[0-9]+");
MessageBox.Show(match.Value);
//提取多个字符串
MatchCollection collection = Regex.Matches(str, "[0-9]+");
foreach (Match item in collection)
{
MessageBox.Show(item.Value);
}
提取组
//如果想要对已经匹配的字符串再进行分组提取,就用到了“提取组”的功能
//通过添加()就能实现提取组
//在正则表达式中只要使用()就表示进行了分组。小括号既有改变优先级的作用又有提取组的作用。
string path = @"2.26.txt";
string txt = File.ReadAllText(path, Encoding.Default);
MatchCollection matches = Regex.Matches(txt, "([-0-9a-zA-Z_.]+)@([0-9a-zA-Z]+([.][a-zA-Z]+)+)");
foreach (Match item in matches)
{
//group属性就是已经分好的组,value属性表示里面的值
//分组首先第0组是整个整体,然后根据左半括号进行继续划分组
textBox1.AppendText(item.Groups[0].Value + "\t" + item.Groups[1].Value + "\t" + item.Groups[2].Value + "\r\n");
}
//提取日期字符串中的年月日
string dateStr = "June 26 , 1951 ";
Match match = Regex.Match(dateStr, @"([a-zA-Z]+)\s*([0-9]{2})\s*,\s*([0-9]{4})\s*");
foreach (var item in match.Groups)
{
MessageBox.Show(item.ToString());
}
//另一种匹配方式
MatchCollection matches = Regex.Matches(dateStr, @"[0-9a-zA-Z]+");
foreach (Match item in matches)
{
MessageBox.Show(item.Value);
}
//提取ip地址和端口号和协议名称
string str = "192.168.10.5[port=21,type=ftp]";
Match match = Regex.Match(str, @"(.+)\[port=([0-9]{2}),type=(.+)\]");
foreach (var item in match.Groups)
{
MessageBox.Show(item.ToString());
}