正则表达式,高阶函数

最新推荐文章于 2024-05-10 09:38:05 发布

bane_atropos

最新推荐文章于 2024-05-10 09:38:05 发布

阅读量217

点赞数

本文链接：https://blog.csdn.net/bane_atropos/article/details/93499183

版权

排列:
itertools.permutations(iter,r)
参数一:可迭代对象
参数二:取元素的个数
注意:可迭代对象中的元素不能重复[与顺序有关]
功能:返回从可迭代对象中取出r个元素的排列,以迭代器的方式返回.

组合:
itertools.combinations(iter,r)
参数一:可迭代对象
参数二:取元素的个数
功能:从iter中取r个元素的组合
功能:iter2中不能重复

排列组合:
itertools.produce()

正则表达式其实就是一个字符串,使用这个字符串来进行描述某个语法规则搜索的模式.
re.findall(pattern,string)
参数一:正则表达式
参数二:被正则的字符串
功能:对string进行正则匹配,将匹配到的结果作为列表返回

匹配单个字符
.匹配除换行符(\n)以外的任意字符
[]字符集合,表示匹配[]中任意一个字符
[0-9] 表示匹配任意的数字
[a-z] 表示匹配所有小写字母
[A-Z] 表示匹配所有大写字母
[0-9a-zA-Z_] 表示匹配数字字母下划线
[^0-9]在[]中表示脱字节,非数字
\d 表示匹配数字,效果同[0-9]
\D 表示匹配非数字,效果同[^0-9]
\w 表示匹配数字字母下划线,效果同[0-9a-zA-Z_]
\W 表示匹配非数字字母下划线,效果同[^0-9a-zA-Z_]
\s 表示匹配空白符效果同[\r\n\f\t]
\S 表示匹配非空白符效果同[^\r\n\f\t]

^ 行首匹配,从每一行的开始进行匹配
$ 行尾匹配,匹配每一行的结束
\A 匹配字符串的开始,与^的区别是,及时在re.M的模式下也不会匹配其他行的行首
\D 匹配字符串的结束,与$的区别是,即使在re.M的模式下,也不会匹配其他行的行尾
\b 匹配单词的边界 \b写在左边匹配左边界,写在右边匹配右边界
\B 匹配单词的非边界 \B写在左边不匹配左边界,写在右边不匹配右边界

(xyz)将括号中的内容作为一个整体来进行匹配
x? 匹配0个或者1个x 尽可能少的匹配
x* 匹配0个或者多个x,贪婪匹配,尽可能多的匹配
x+ 匹配至少一个,贪婪匹配,尽可能多的匹配
x{n} 匹配确定的n个x
x{n,} 匹配至少n个x,贪婪匹配
x{n,m} 匹配至少n个x,至多m个x

.*? 经常一起连用,.代表任意字符 *尽可能多的匹配,?对贪婪匹配的限制

‘’’
import re
def istel(s):
if re.findall(r"^1\d{10}$",s):
print(“号码%s合法”%s)
else:
print(“号码%s不合法”%s)

istel(“18765819673”)

def ise_mail(h):
if re.findall(r"¹{5,11}@(qq|163|sina).com$",h):
print(“y”)
else:
print(“n”)

ise_mail("baneatropos@qq.com")

print(re.findall(r"/*.*?*/","/uei//uei//uei//uei/"))

‘’’
re.compile(pattern,flags)
参数一:正则表达式
参数二:标志位
功能:将正则表达式编译成一个正则对象然后返回,调用的时候调用正则对象即可.
re.match(pattern,string,flags)
参数一:正则表达式
参数二:string
参数三:标志位
功能:对string从字符串开始匹配,若匹配的上则返回匹配成功的对象,若匹配不上则
返回None.
注意:这并不是一个完全匹配,若匹配成功之后,string有剩余仍然匹配成功,若要完全
匹配,可以在正则的末尾添加$即可.
re.search(pattern,string,flags)
参数一:正则表达式
参数二:字符串
参数三:标志位
功能:以指定的正则格式在string进行查找若找到则直接返回第一匹配成功的对象,不再
再继续匹配,若找不到返回None.
re.findall(pattern,string,flags)
功能:以指定的正则表达式取string中进行匹配,把所有匹配的结果作为list返回.若没有
匹配上则返回空列表.
re.finditer(pattern,string,flags)
功能:以指定的正则表达式取string中进行匹配,把所有匹配的结果作为迭代器返回.
re.split(pattern,string,maxsplit,flags)
maxsplit:指定最大切片次数,若不指定,全部切片
功能:以指定的正则表达式对string进行切片,并且将切片的结果作为列表返回.
re.sub(pattern,repl,string,count)
功能:将匹配到的字符串以指定的repl进行替换并且返回替换后的结果
count:指定替换的次数,若不指定则默认全部替换

filter(func,iter1)
参数一:func 有且只有一个参数,返回值必须是bool值
参数二:可迭代对象
功能:进行数据过滤,将iter1中的元素依次取出,作用于func,根据func返回的是True
还是False决定是否保留该元素.

‘’’
list1 = [1,2,3,4,5,5,6,6,7,27,7,2745,]
print(list(filter(lambda x:True if x%2 != 0 else False , list1)))

data = [[“张三”,28,“吃”],[“tom”,25,“无”],[“aouhghdlg”,26,“金钱”]]
print(list(filter(lambda x: True if x[2]!= “无” else False,data)))

‘’’
sorted(iterable,key ,reverse)
参数一:可迭代对象
参数二:key,比较规则
参数三:默认升序,reverse = True 降序排列
功能:将可迭代对象依次作用于key后面的函数,然后根据作用的结果进行排序

‘’’
data = [[“张三”,28,“吃”],[“tom”,25,“无”],[“aouhghdlg”,26,“金钱”]]

print(list(sorted(data,key = lambda x:x[1] ,reverse=True)))

list3 = [12,“333”,“22”,342,“322”,144,523,“32”]
print(list(sorted(list3,key = int,reverse= True)))
‘’’
zip(iterq,iter2,…)
功能:将多个可迭代对象的对应位置的数据进行打包处理,长度由最短的决定,返回一个打包
好的zip对象[迭代器]
zip(*zipobj)
功能:将zip对象进行解包处理
‘’’
dict1 = {1:“hello”,2:“good”,3:“nice”}
print(dict(zip(dict1.values(),dict1.keys())))

‘’’
sum(iter)
参数:可迭代对象,元素必须是number类型
功能:返回可迭代对象相加的结果

文档测试:
1.首先导入dectest模块
2.可以已提取函数中的注释进行执行,注释一定要按照doc下面的格式进行书写
3.执行doctest.testmod()