正则表达式是什么
正则表达式是一种匹配输入文本的模式,它支持比较复杂的匹配模式,不是简单的字符串与字符串的相等对比。
项目里正则表达式的应用
筛查文本的工作非常适合正则表达式,例如检查业务代码使用中文的地方,项目为了做多语言版本,不能存在手写中文的业务代码,要求全部用读表。以C#代码为例,首先要排除掉注释,因为注释用了大量中文,但不在筛查范围之内。
检查步骤应该是:
- 过滤注释行
- 过滤日志行
- 该行是否有中文
string partern1 = "[\u4e00-\u9fa5]";//有中文
string partern2 = "^[//]";//以//开头
string partern3 = "[*/]$";//以*/结尾
Regex reg1 = new Regex(partern1);
Regex reg2 = new Regex(partern2);
Regex reg3 = new Regex(partern3);
string target1 = "AAA";
bool ret1 = reg1.IsMatch(target1);
print("ret1: " + ret1);
string target2 = "//ABC";
bool ret2 = reg2.IsMatch(target2);
print("ret2: " + ret2);
string target3 = "aaaa*/";
bool ret3 = reg3.IsMatch(target3);
print("ret3: " + ret3);