【坚持不能偷懒】
这个分类属于个人经验,顺手记下每天的一些情况,自己看得懂就行……
每天都得看点东西……
今天看了遍正则表达式,又拿python出来练练手
r'((?P<word>http:\/\/\w+\.(?:(?:png)|(?:jpg)|(?:gif)))(?P=word))'
这是我用于测试的一个串
(?P<name>\d)是命名,这个保存下来的,是匹配出的结果,而不是一个模式
(?P=name)是引用前面匹配出的结果,譬如前面匹配了\d的一个6,后面也是识别这个6,而不是\d
在用findall函数的时候
py3它是找出每一个()里匹配的东西,而有时要想匹配最外面的大模式
需要给最外面加一个()
而为了忽略一些不需要单独拎出来的(),可以写成(?:)的形式,表示忽略这个命名空间(是不是这名字来着)
贪婪和非贪婪匹配
譬如我用一个r'a*'匹配串'aaaaa',非贪婪匹配一个a,贪婪就是一口气aaaaa了
一个不错的教程——正则表达式30分钟入门教学
http://deerchao.net/tutorials/regex/regex.htm#greedyandlazy
作者在文章的最后说……30分钟是骗你点进去读的……
Py3的匹配,譬如(?P<name>),与教材中有区别。
另外,作者举例的IP地址匹配,如果直接套用到Py3中,会匹配不出,因为要加个外围括号,否则只会匹配出()里的东西。