为了从长文本中抽取给定的关键词,可以使用 Python 中的正则表达式。
首先,需要安装 re
模块,这是 Python 的正则表达式库。
然后,使用 re.findall
函数可以在文本中查找所有匹配给定正则表达式的字符串。例如,假设要从文本中抽取所有数字,可以使用以下代码:
import re
text = "The quick brown fox jumps over the lazy dog. 1234567890"
numbers = re.findall(r'\d+', text)
print(numbers)
输出结果为:
['1234567890']
如果要抽取给定的关键词,可以将正则表达式替换为关键词的模式。例如,假设要抽取所有 "cat" 和 "dog",可以使用以下代码:
import re
text =