一.Python中glob模块用法
glob是python自己带的一个文件操作相关模块,用它可以查找符合自己目的的文件,类似于Windows下的文件搜索,支持通配符操作
. - - 当前目录
. . --当前目录的上一级目录
“*” - -0个或多个字符
? 一个任意字符
[…]匹配指定范围内的字符,如[0-9]匹配数字。
两个主要方法如下。
1.glob方法:
glob模块的主要方法就是glob,该方法返回所有匹配的文件路径列表(list);该方法需要一个参数用来指定匹配的路径字符串(字符串可以为绝对路径也可以为相对路径),其返回的文件名只包括当前目录里的文件名,不包括子文件夹里的文件。
import glob
print(glob.glob('/etc/*.conf'))
print(glob.glob('/etc/????.conf', recursive=True))
print(glob.glob('/etc/*[0-9]*.conf'))
print(glob.glob('/etc/*[A-Z]*.conf'))
print(glob.glob('/etc/*[0-9A-Z]*.conf'))
- iglob方法:
获取一个迭代器( iterator )对象,使用它可以逐个获取匹配的文件路径名。与glob.glob()的区别是:glob.glob同时获取所有的匹配路径,而 glob.iglob一次只获取一个匹配路径。
import glob
print(glob.iglob('/etc/*.conf'))
要想获取所有路径,我们可以使用遍历方法实现查看路径
import glob
x = (glob.iglob('/etc/*.conf'))
for py in x:
print (py)
二.正则表达式3种处理函数
1.re.findall 函数
re.findall 从字符串的所有位置匹配一个模式,如果匹配不到,就返回一个空列表
函数语法:
re.findall(pattern, string, flags=0)
函数参数说明:
pattern :匹配的正则表达式
string :要匹配的字符串。
flags :标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。
示例:
import re
s = "kiosk/home/kiosk/westosanaconda2/envs/blog/bin/python3.6/home/kiosk/Desktop/day25"
# 1. 编写正则的规则
pattern1 = r'westos' ###规则前要用‘r‘标注
pattern2 = r'kibgbosk'
# 2. 通过正则去查找匹配的内容
print(re.findall(pattern1, s))
print(re.findall(pattern2, s))
2.re.match函数
re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就会返回一个None对象。函数语法:
re.match(pattern, string, flags=0)
匹配成功re.match方法返回一个匹配的对象。
我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。
匹配对象方法 :
1).group(num=0) 匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。
2). groups() 返回一个包含所有小组字符串的元组,从 1 到 所含的小组号。
import re
s = "kiosk/home/kiosk/westosanaconda2/envs/blog/bin/python3.6/home/kiosk/Desktop/day25"
# 1. 编写正则的规则
pattern1 = r'kiosk'
pattern2 = r'kibgbosk'
# 2. 通过正则去查找匹配的内容
print(re.match(pattern