软件测试|使用Python提取出语句中的人名

最新推荐文章于 2024-10-14 18:47:13 发布

测试界曦曦

最新推荐文章于 2024-10-14 18:47:13 发布

阅读量1.4k

点赞数 11

分类专栏：软件测试文章标签： python 开发语言功能测试软件测试自动化测试程序人生职场和发展

本文链接：https://blog.csdn.net/NHB456789/article/details/135625346

版权

软件测试专栏收录该内容

877 篇文章

订阅专栏

简介

在自然语言处理（NLP）中，提取文本中的人名是一项常见的任务。Python作为一种流行的编程语言，拥有强大的NLP库和工具，使我们能够轻松地进行这项任务。在本文中，我们将使用Python示例来演示如何提取文本中的人名。

环境准备

我们将使用以下Python库来执行人名提取任务：

spaCy：一个流行的NLP库，它提供了命名实体识别（NER）功能，可以帮助我们识别文本中的人名。
re：Python的正则表达式库，用于进行文本模式匹配。

re是Python自带的库，所以我们不需要额外进行安装，但是spaCy是第三方库，需要我们安装，安装命令如下：

pip install spacy

注：当我们安装spaCy库之后，还需要安装其语言模型，安装命令如下：

# 英文模型
python -m spacy download en_core_web_sm
# 中文模型
python -m spacy download zh_core_web_sm

示例代码

下面是一个Python示例，演示如何使用spaCy库来提取文本中的人名：

import spacy

# 加载spaCy的英文模型
nlp = spacy.load("zh_core_web_sm")

# 输入文本
text = "欢迎大家参加本次活动。张三、李四和王五将会发表演讲。"

# 使用spaCy处理文本
doc = nlp(text)

# 提取人名
people_names = []
for ent in doc.ents:
    if ent.label_ == "PERSON":
        people_names.append(ent.text)

# 打印提取到的人名
for name in people_names:
    print(name)

在上面的示例中，我们首先加载了spaCy的英文模型，并指定了文本。然后，我们使用spaCy对文本进行处理，识别其中的命名实体。最后，我们筛选出标记为"PERSON"（人名）的实体，并将它们存储在people_names列表中。

运行代码，输出结果如下：