regular expression
bdss58
这个作者很懒,什么都没留下…
展开
-
正则表达式(regular expression)特殊字符(special charactors)1
注:文中例子使用Python中的正则表达式re模块。1. 原意字符正则表达中最基本的字符是单个原意字符。例如p中的’a',匹配s中的单个'a', 匹配位置在s中第一次出现a的位置。>>> re.search(r'a', 'I am a foolish man').group()'a'>>> re.search(r'cat', 'about cats and dogs').gr原创 2015-01-31 23:57:56 · 2665 阅读 · 0 评论 -
正则表达式 —— 点(dot)
注:由于 "."这个符号不是很明显,所以本文一律用英文dot代替。在正则表达式中dot几乎匹配任意一个字符,但是不匹配换行符\n。例子:谨慎使用dotdot是一个很强大的正则表达式“元符号”,一不小心就会用错。例如当需要匹配日期格式如:mm/dd/yy,其中分隔符/不局限于此,用户可以选择其他的符号。我们可以快速写出一个正则表达式去匹配:/d/d./d/d./d/d,这样的原创 2015-02-02 14:30:54 · 24513 阅读 · 0 评论 -
正则表达式 —— 插入符(anchor, ^)和美元符($)
注:例子使用Python的re模块。由于插入符(^)输入和表示不是很明显,所以使用英文anchor代替。正则表达式的符号大部分都是用来匹配字符串中单个字符的,但是 ^ 和 $不是用来匹配单个字符的,而是匹配位置,分别匹配开始位置和结束位置。将表达式^a应用到字符串abc上,会得到匹配结果a。而^b不会匹配abc任意字符。print re.search(r'^a','abc'原创 2015-02-03 13:50:59 · 6248 阅读 · 0 评论 -
正则表达式(单词边界 \b)
如果使用正则表达式查找某个单词,最好还是使用\b包裹需要查找的表达式。比如,在this island is beautiful中查找‘is’这个单词,如果直接使用is作为表达式,那么查找结果就是this中的is。>>> import re>>> re.search(r'is','this island is beautiful').span()(2, 4)如果使用\bis\b作为表原创 2015-02-10 22:17:00 · 2786 阅读 · 0 评论 -
正则表达式(候选项)
在正则表达式中用问号?紧跟一个字符后面,表明这个字符“可有可无”。比如表达式“colou?r不仅可以匹配color,也可以匹配colour.表达式”nov(ember)?"可以匹配nov和november其实用大括号也可以达到“候选项“效果。比如表达式‘colou{0,1}r同样同时匹配color和colour。由于表达式引擎的贪心性质,表达式Feb 23(rd)?匹配Today原创 2015-02-12 21:44:21 · 848 阅读 · 0 评论 -
正则表达式(候选模式匹配)
使用“ | ” 符号在正则表达式中,可以同时匹配多个表达式。比如使用 get | getvalue | set | setvalue这样的表达式去匹配setvalue.>>> re.search(r'get|getvalue|set|setvalue', 'setvalue').span()(0, 3)从输出结果来看,第三个表达式匹配成功。原创 2015-02-12 21:26:30 · 884 阅读 · 0 评论