notepad++正则表达式使用笔记:
1.查找空行:^\s*\r\n
2.排除以(开头的行:^(?!().*$
3.查找第二行以A-D开头的情况:(\r\n)(^[A-D])
4.查找不含有helloworld的行:^(?!.*helloworld).*$
5.查找不以com结尾的字符串:^.*?(?<!com)$
6.查找汉字:[一-龥!-~]
7.查找某段区域(比如中国[变量]党):中国((?<!中).)+党
8.查找以A开头B结尾,不含VIRTUAL的字符串:A((?<!VIRTUAL).)+B
9.查找非汉字:[^一-龥!-~]+
10.查找HTML注释或者script\style\textarea|xmp:<!--.*?--\s*>|<(script|style|textarea|xmp)\b(?:[^>"']|"[^"]*"|'[^']*')*?(?:/>|>.*?</\1\s*>)
11.查找非换行空白:(\s)(?<!^)
12.查找汉字和数字中间的内容:([一-龥!-~]+).+?(?=\d) 或者(2H3....0).*?(?=[一-龥!-~])
配合 \1 \2进行替换
13.非贪婪算法,获取汉字前的空白内容:(\s+?)(?=[一-龥!-~])
14.
问题:[一-龥!-~]+不起作用
解决:将文档转为utf-8格式
15.查找某个标记(<one:OCRText>)及之间的内容:
<one:OCRText>(\s|\S)+?(</one:OCRText>)
16.非贪心算法:
(<one:.+?>)
17.题目序号查找
(\d{1,2}\.[一-龥!-~])
18.查找教材段落
(^(?!(|\(|\d|[一\二\三\四\五\六\七\八\九]).*)(\r\n)
19.查找教材段落
(^(?!(|\(|\d|【|[一\二\三\四\五\六\七\八\九]).*)(?!。\r\n)(^(?!(|\(|\d|【|[一\二\三\四\五\六\七\八\九]).*)
用\1\3替换
20.
(^(\d\.)|()[一-龥!-~]{7,}.*)(\r\n)(^(?!(|\(|\d|[一\二\三\四\五\六\七\八\九]).*)
(^\d\).{21,}.*)(\r\n)(^(?!(|\(|\d|【|[一\二\三\四\五\六\七\八\九]).*)
21.查找不以以某些内容开头,不以 。结尾的行与下一个不以以某些内容开头的行
(^(?!(|\(|\d|【|[一\二\三\四\五\六\七\八\九\十]).{21,}[^。]$)(\r\n)(^(?!(|\(|\d|【|[一\二\三\四\五\六\七\八\九]).+)
使用\1\3替换
(^(?!(|\(|\d|【|[一\二\三\四\五\六\七\八\九]).*)(?!。\r\n)(^(?!(|\(|\d|【|[一\二\三\四\五\六\七\八\九]).*)
21.排除数字开头
(^(?!\d).*)
22.查找以某些内容开头,不以" 。"结尾的行与下一个不以以某些内容开头的行
(^\(\d.{21,}[^。]$)(\r\n)(^(?!(|\(|\d|【|[一\二\三\四\五\六\七\八\九]).+)
(^\(\</one:Image\>$)(\r\n)(^(?!\<one:Image.+)
23.查找断行的语句
<a([^\n]|[\n])+?href="http://111">
24.onenote图片加入outline
查找
(^</one:Image>$)(\r\n)(^(?!(</one:Outline>)|(<one:Image)).+)
提换
25.查找上行有 </one:Image>下行没有</one:OE>)
</one:Image>\r\n^(?!.*</one:OE>).*$
26.替换附件图片
查找(<one:InsertedFile[\S\s]+?)(y=".+?")
替换成y="20"
27.查找非法命名字符
[<][>][/][\][|][: ][*][?]
[<>/\|: *?]
28.查找最后一行
^(?!.*[\r\n]).*$
29.查找排除"开头或还有★的句子
^(?!"|.*★).+$
30.处理教材目录
(^.*[一-龥!-~])(.*)(....$)
31.生成sql语句
\1 from history_allcol where \>0 \r\nunion