-
匹配字符串
通过使用re.search(regex,string)这个方法,可以检查这个string字符串是否匹配正则表达式regex。如果匹配到,这个表达式会返回一个match对象,如果没有匹配到则返回None。
1.获取包含关键字的句子
import re
text_string = '文本最重要的来源无疑是网络。我们要把网络中的文本获取形成一个文本数据库。利用一个爬虫抓取到网络中的信息。爬取的策略有广度爬取和深度爬取。根据用户的需求,爬虫可以有主题爬虫和通用爬虫之分。'
regex = '文本'
p_string = text_string.split('。')
for line in p_string:
if re.search(regex,line) is not None:
print(line)
输出结果为:
文本最重要的来源无疑是网络
我们要把网络中的文本获取形成一个文本数据库
2.匹配任意一个字符
"."代替任何单个字符(换行除外)
import re
text_string = '文本最重要的来源无疑是网络。我们要把网络中的文本获取形成一个文本数据库。利用一个爬虫抓取到网络中的信息。爬取的策略有广度爬取和深度爬取。根据用户的需求,爬虫可以有主题爬虫和通用爬虫之分。'
regex = '用户.' # "."代替任何单个字符