NLP基本知识一
一.从文本中获得含有关键词的句子
import re
test=open("测试.txt")
test_string=test.read()
regex='爬虫‘
p_string=test_string.split('。')
for line in p_string:
if re.search(regex,line) is not None:
print(line)
运行结果:
二. 获取可以匹配任意字符的句子,“."代替任何单个字符(换行除外)
import re
test=open('测试.txt')
test_string=test.read()
regex='爬.’
p_string=test_string.split('。')
for line in p_string:
if re.search(regex,line) is not None:
print(line)
运行结果:
三. 获取以特定字符开始和结束的句子,"^a"代表匹配所有以字母a开头的字符串,"a$"代表所有以字符串a结尾的字符串。