Anaconda下安装和使用Stanza中文模型

预备步骤

创建anaconda虚拟环境

官网说目前stanza不支持Python3.8的anaconda 命令安装,这里安装Python3.7。

conda create -n test python=3.7

之后激活虚拟环境,开始安装stanza

下载stanza安装包

在虚拟环境中,使用官方提供的安装命令:

conda install -c stanfordnlp stanza

使用 conda list 命令检查是否安装了最新版本,如果不是,使用conda uninstall stanza 命令卸载,再用如下命令重装:

conda install -c stanfordnlp stanza==1.4.0

由于旧版本兼容会有一些问题,这里卸载重装最新的1.4.0版本。
安装包很大,需要一点时间。再次确认安装版本,
在这里插入图片描述
后面出现正确版本号,说明下载成功。

添加中文语言包

之后,需要在指定的~/resouces/ 文件夹下下载中文语言模型。
先使用如下代码进行测试:

>>> import stanza
>>> zh_nlp = stanza.Pipeline('zh')

报错:

stanza.resources.common.ResourcesFileNotFoundError: Resources file not found at: C:\Users\user\stanza_resources\resources.json  Try to download the model again.

原因是没有找到resources.json文件, 这里去github上寻找该文件下载资源
stanza-resources
,页面如下:
在这里插入图片描述
这里有多个版本,我们选择resources_1.4.0.json 下载,并改名为“resources.json”保存到错误提示中提到的C:\Users\user\stanza_resources文件夹中。
接着去Hugging Face网站找相应的中文语言模型下载页面stanza-zh-hans,下载default.zip文件。
在这里插入图片描述
将default.zip解压后,在上文中的 C:\Users\user\stanza_resources目录下新建一个名为“zh-hans”的文件夹,将解压后的文件全部复制到zh-hans文件夹。
在这里插入图片复制好后描述

测试

到此,所有安装文件都已准备完毕,继续使用上文的测试代码测试

>>> import stanza
>>> zh_nlp = stanza.Pipeline('zh')

这时,仍然报错:

requests.exceptions.ConnectionError: HTTPSConnectionPool(host='raw.githubusercontent.com', port=443): Max retries exceeded with url: /stanfordnlp/stanza-resources/main/resources_1.4.0.json (Caused by NewConnectionError('<urllib3.connection.HTTPSConnection object at 0x000001A6708B8708>: Failed to establish a new connection: [Errno 11004] getaddrinfo failed'))

这个错误是说,程序试图通过githubusercontent.com这个域名下载resources_1.4.0.json 时连接失败。这里需要修改程序。让模型去调用我们自己下载的resources.json文件。 具体做法如下:
打开虚拟环境所在目录,找到 ~\Lib\site-packages\stanza\resources\commom,py文件,注释掉download_resources_json()这个函数中的request_file()方法。
原文出处:https://github.com/stanfordnlp/stanza/issues/331#issuecomment-694155072


修改好后,重新启动虚拟环境,再次测试:

>>> import stanza
>>> zh_nlp = stanza.Pipeline('zh')
>>> doc = zh_nlp('我喜欢自然语言处理。')
>>> print(doc)

出现以下结果:

[
  [
    {
      "id": 1,
      "text": "我",
      "lemma": "我",
      "upos": "PRON",
      "xpos": "PRP",
      "feats": "Person=1",
      "head": 2,
      "deprel": "nsubj",
      "start_char": 0,
      "end_char": 1,
      "ner": "O",
      "multi_ner": [
        "O"
      ]
    },
    {
      "id": 2,
      "text": "喜欢",
      "lemma": "喜欢",
      "upos": "VERB",
      "xpos": "VV",
      "head": 0,
      "deprel": "root",
      "start_char": 1,
      "end_char": 3,
      "ner": "O",
      "multi_ner": [
        "O"
      ]
    },
    {
      "id": 3,
      "text": "自然",
      "lemma": "自然",
      "upos": "NOUN",
      "xpos": "NN",
      "head": 4,
      "deprel": "nmod",
      "start_char": 3,
      "end_char": 5,
      "ner": "O",
      "multi_ner": [
        "O"
      ]
    },
    {
      "id": 4,
      "text": "语言",
      "lemma": "语言",
      "upos": "NOUN",
      "xpos": "NN",
      "head": 5,
      "deprel": "nsubj",
      "start_char": 5,
      "end_char": 7,
      "ner": "O",
      "multi_ner": [
        "O"
      ]
    },
    {
      "id": 5,
      "text": "处理",
      "lemma": "处理",
      "upos": "VERB",
      "xpos": "VV",
      "head": 2,
      "deprel": "ccomp",
      "start_char": 7,
      "end_char": 9,
      "ner": "O",
      "multi_ner": [
        "O"
      ]
    },
    {
      "id": 6,
      "text": "。",
      "lemma": "。",
      "upos": "PUNCT",
      "xpos": ".",
      "head": 2,
      "deprel": "punct",
      "start_char": 9,
      "end_char": 10,
      "ner": "O",
      "multi_ner": [
        "O"
      ]
    }
  ]
]

说明安装成功,这样就可以开始使用stanza处理中文啦。

  • 10
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
Anaconda是一个用于数据科学和机器学习的开源软件包集合。它包含了很多常用的Python库和工具,可以方便地进行数据分析、可视化和模型训练等任务。关于Anaconda安装使用,可以参考以下步骤: 1. 下载安装Anaconda:可以从Anaconda官方网站下载合适版本的Anaconda安装包,并按照安装向导进行安装。 2. 设置环境变量:安装完成后,为了能够在命令行中直接使用Anaconda提供的工具和库,需要将Anaconda安装路径添加到系统的环境变量中。可以在系统的"环境变量"设置中添加Anaconda安装路径。 3. 使用Conda操作:Conda是Anaconda的包管理器,可以帮助你安装、更新和管理各种Python包。通过使用Conda,你可以创建Python虚拟环境、安装特定版本的包等。具体的Conda操作可以参考Anaconda官方文档或其他教程。 4. 使用Anaconda Navigator:Anaconda Navigator是一个可视化管理工具,可以帮助你更方便地管理和使用Anaconda。在Navigator中,你可以打开Jupyter Notebook、Spyder等常用的工具,也可以安装、更新和删除Python包。具体的Navigator操作可以参考Anaconda官方文档或其他教程。 5. 使用Spyder:Spyder是Anaconda中一个强大的集成开发环境(IDE),专门用于科学计算和数据分析。你可以使用Spyder进行代码编写、调试和运行,同时还可以利用其丰富的特性进行数据分析和可视化。 6. 使用Jupyter Notebook:Jupyter Notebook是一个交互式笔记本环境,可以在其中编写和运行代码、展示图像和结果,并进行实时的数据分析和可视化。你可以通过Navigator打开Jupyter Notebook,也可以在命令行中输入"jupyter notebook"命令来启动。 综上所述,你可以按照上述步骤来安装使用Anaconda进行数据科学和机器学习的工作。希望这些信息对你有所帮助!<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Anaconda安装使用](https://blog.csdn.net/weixin_42570192/article/details/124726810)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Anaconda 安装、配置、使用详细教程](https://blog.csdn.net/u012912039/article/details/101675345)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值