这篇总结很片面,只是对于python中使用正则的初步认识。
python中通过导入re模块提供对正则表达式的支持。
下文主要针对python3进行解释
import re
pattern = re.compile('hello')
match = pattern.match('hello world!')
print(match.group())
结果:
-----hello
import re
word = 'http://www.baidu.com'
key = re.findall('h',word)
print(key)
结果:
['h']
后来发现在菜鸟联盟上有很详细的关于正则表达式的总结(http://www.runoob.com/python3/python3-reg-expressions.html)
P.S.:菜鸟联盟上对两个版本的python都有很详细的讲解,看过之后才发现自己对于正则表达式的认识只是冰山一角。。。以后再具体更新
下面记录一个实例:
可以根据一个网页的源代码,利用正则表达式匹配网页中重复出现的信息。
例如,可以对慕课网网页源代码中的课程名前面的代码进行正则,可以显示所有的课程名称