Python 模糊匹配:glob, re, fnmatch

Python 专栏收录该内容
6 篇文章 0 订阅
'''
fnmatch模块: 提供对Unix Shell通配符的支持
Pattern Meaning 
*       matches everything 
?       matches any single character 
[seq]   matches any character in seq 
[!seq]  matches any character not in seq 

'''

import os
import fnmatch
for file in os.listdir('.'):
    if fnmatch.fnmatch(file, '*.py'):
        print file

'''
glob模块: 查找所有满足Unix Shell模式规则的路径名
'''

import os
import glob
for f in glob.glob(os.path.join(os.path.abspath('.'), '*')):
    print f


Python的正则表达式类似于Perl语言。


re正则表达式使用'\'进行转义, 而Python语言也使用'\'在字符串的转义;因此,为了匹配'\', 必须使用'\\\\'作为模式。
因为正则表达式必须是\\,而在字符串中每一个\需要两个\\表示。


对于正则表达式模式,我们可以使用原始字符串(raw string)。原始字符串中的\只作为普通字符串处理。因此,r'\n'表示两个
字符,'\'和'n',但是在普通字符串中, '\n'将作为换行符处理。


re中的特殊字符:
'.' 匹配任意字符, 除了换行。如果 DOTALL标记打开,将匹配所有字符,包括换行。
'^' 匹配字符串的开始。
'$' 匹配字符串的结束。


'*' 0或多次重复匹配。
'+' 1或多次重复匹配。
'?' 0次或1次匹配。
*?, +?, ?? 对应于'*', '+', '?'的非贪心匹配。
{m} m次重复匹配
{m, n} m到n次重复匹配,省略m表示m = 0, 省略n表示n无穷大。
{m, n}? 与*?, +?, ??类似, 非贪心匹配。
[]  匹配字符集。
|   A|B,表示匹配A或B。
()     正则表达中组的概念。


\d  匹配十进制数
\D  匹配非非数字字符
\s  匹配空白
\S  匹配非空白
\w  匹配任意数字和字母
\W  匹配任意非数字和字母


url = 'http://www.contoso.com:8080/letters/readme.html'
obj = re.match(r'(.*)//(.*):(\d+)(.*)', url)
print obj.groups()

lstStr = ['local 127.0.0.1', 'Lucy 192.168.130.2', 'Link 192.168.130.224']
for s in lstStr:
    obj = re.match(r'.*?(\d+.\d+.\d+.\d+).*?', s)
    print obj.groups()


  • 1
    点赞
  • 0
    评论
  • 2
    收藏
  • 一键三连
    一键三连
  • 扫一扫,分享海报

相关推荐
©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值