目录
正则表达式介绍
正则表达式,也称为规则表达式或Regular Expression,是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"),是计算机科学的一个概念。它是一种用于匹配和操作文本的强大工具,是由一系列字符和特殊字符组成的模式,用于描述要匹配的文本模式。正则表达式可以在文本中查找、替换、提取和验证特定的模式。例如,“runoo+b”可以匹配 runoob、runooob、runoooooob等,其中 "+" 号代表前面的字符可以出现一次或多次。
此外,正则表达式提供了一种灵活且强大的方式来查找、替换、验证和提取文本数据,可以应用于各种编程语言和文本处理工具中,如JavaScript、Python、Java、Perl等。
一、常见元字符
二、正则解析实例
日志1:域控的安全日志
2019-09-17 16:59:14|!10.91.3.13|!webids-ioc_dolog|!{"rule_desc": "DarkKomet 远控木马活动事件", "campaign": "", "packet_data": "UNoA8ePmnAYbAGPWCAB FAABMZABAAH0RAnCsGAYM3wYGBuxfADUAOJ10LJsBAAABAAAAAAABCXIxZTBy MTk3cgVuby1pcANiaXoAAAEAAQAAKQ+gAACAAAAA", "dns_arecord": "", "tproto": "udp", "tag": null,
解析:.*?\|\!(?<type>\w+\-\w+).*rule_desc":\s\"(?[^\"]*).*packet_data":\s\"(?[^\"]*)
日志2:ids日志
Mar 23 09:35:35 skyeye SyslogClient[1]: 2021-03-23 09:35:35|!10.21.200.222|!webids-ids_dolog|!{"attack_type": "暴力猜解",
解析:\w+\s\d+\s\d+\:\d+\:\d+\s\w+\s\w+\[\d+\]\:\s(?\d+\-\d+\-\d+\s\d+\:\d+\:\d+).*attack_type":\s\"(?[^\"]*)
三、常用正则匹配表达式
-
手机电话号正则匹配
0?(13|14|15|18|17)[0-9]{9}
16开头的就无法匹配,因为手机号没有16开头的
-
url正则匹配
^((https|http|ftp|rtsp|mms)?:\/\/)[^\s]+
-
mail正则匹配
\w[-\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\.)+[A-Za-z]{2,14}
-
身份证正则匹配
\d{17}[\d|x]|\d{15}
-
格式日期正则匹配
\d{4}(\-|\/|.)\d{1,2}\1\d{1,2}
-
IP地址正则匹配
(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)
-
用户名正则匹配
[A-Za-z0-9_\-\u4e00-\u9fa5]+