hanlp加载预训练模型

最新推荐文章于 2025-03-03 04:55:54 发布

呆萌的代Ma

最新推荐文章于 2025-03-03 04:55:54 发布

阅读量6.6k

点赞数

分类专栏：自然语言处理文章标签：深度学习 python nlp

本文为CSDN博主"呆萌的代Ma"原创文章，转载请注明博客链接：https://blog.csdn.net/weixin_35757704/

本文链接：https://blog.csdn.net/weixin_35757704/article/details/122741836

版权

自然语言处理专栏收录该内容

56 篇文章

订阅专栏

hanlp 预训练模型的文档可以参考：https://hanlp.hankcs.com/docs/api/hanlp/pretrained/index.html

得到全部的预训练模型可以使用python代码：

import hanlp

print(hanlp.pretrained.ALL)

在线加载模型

import hanlp

lp_model = hanlp.load(hanlp.pretrained.mtl.CLOSE_TOK_POS_NER_SRL_DEP_SDP_CON_ELECTRA_SMALL_ZH)

预下载模型

文档中有每个模型的下载链接，可以预先下载，例：

下载：https://file.hankcs.com/hanlp/transformers/electra_zh_small_20210706_125427.zip模型，

创建目录结构：

mkdir ~/.hanlp
cd .hanlp
mkdir mtl
cd mtl

将下载好的模型解压后放到~/.hanlp/mtl/目录下

然后就使用在线加载的模型即可：

import hanlp

lp_model = hanlp.load(hanlp.pretrained.mtl.CLOSE_TOK_POS_NER_SRL_DEP_SDP_CON_ELECTRA_SMALL_ZH)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

呆萌的代Ma

关注关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

NLP模型笔记2022-09：hanlp所有预训练模型API接口使用

源代码杀手的博客

05-27

729

目录1、找出所有预训练模型为后续训练模型准备2、如何使用上述模型？2.1、以分词模型为案例2.2、以分词、词性、实体识别、句法模型为统一的模型参考文献 HanLP2.1支持包括简繁中英日俄法德在内的104种语言上的10种联合任务：分词（粗分、细分2个标准，强制、合并、校正3种词典模式）词性标注（PKU、863、CTB、UD四套词性规范）命名实体识别（PKU、MSRA、OntoNotes三套规范）依存句法分析（SD、UD规范）成分句法分析语义依存分析（SemEval16、DM、PAS、PS

在Linux服务器上部署BERT预训练模型——展示了如何在Linux服务器上使用Docker容器部署BERT预

AI天才研究院

08-07

2232

自然语言处理（NLP）技术一直以来都是非常热门的研究领域。深度学习（DL）也逐渐成为NLP的重要组成部分，并且BERT预训练模型已经成为事实上的标准模型。因此，了解BERT预训练模型及其部署至生产环境是一个必不可少的技能。本文将以BERT预训练模型的部署方式来介绍如何在Linux服务器上使用Docker容器部署BERT预训练模型。

3 条评论您还未登录，请先登录后发表或查看评论

hanlp分词es插件字典和模型大全

08-18

兼容es6和es7 data：分词模型和字典 elasticsearch-analysis-hanlp-7.x.x：es插件安装包，安装说明在包内 elasticsearch-analysis-hanlp-master-7.x.x：es插件源码和引用 HanLP-portable-1.7.3：hanlp分词器源码 1. 修改了hanlp-portable-1.7.3源码中线程不安全问题 2. 修改了elasticsearch-analysis-hanlp-7.x.x插件源码对于es7版本适配性问题，更换新的hanlp-portable源码 3. 新增了人名，车牌，电子邮件，行政区划地址的感知机模型和字典 4. 增加了对es7部署插件的安装说明和java安全策略

04-09

Hanlp本地运行出现的问题及操作步骤分析

最新发布

lvruikai2010的博客

03-03

166

主要原因在最后一行，下载模型uer/albert-base-chinese-cluecorpussmall的时候失败了，下载模型需要访问huggingface.co，而访问huggingface.co需要梯子。看错误信息，好像是large_corpus_cws_albert_base_20211228_160926.zip这个文件下载失败，其实不是，这个文件是下载成功的。搜索需要下载的模型 uer/albert-base-chinese-cluecorpussmall，手动下载下来。

hanlp 训练模型_HanLP2.0

weixin_39607090的博客

12-20

2477

汤连杰大快搜索是一个相对年轻的公司，组建时间不算很长，我们公司主要是聚焦大数据底层软件、大数据开发框架、人工智能这几个方向。在大数据底层软件方面，有DKH大数据分析处理平台，在人工智能方面的主要产品就是HanLP。HanLP从2015年开始进行研发，目前，我们已经开源了全部源代码。由于HanLP1.x的开发主要以传统方式进行，我们可以直接在工程里面进行调用。从HanLP2.0开始，我们走入深度学习...

中文自然语言处理工具HanLP源码包的下载使用记录

weixin_33971130的博客

02-15

214

这篇文章主要分享的是hanlp自然语言处理源码的下载，数据集的下载，以及将让源代码中的demo能够跑通。Hanlp安装包的下载以及安装其实之前就已经有过分享了。本篇文章主要还是备忘之用，同时算是给新手朋友的一些参考吧！不过在此之前先推荐两本书给想要学习中文自然语言处理的朋友，分别是《NLP汉语自然语言处理原理与实战》，里面介绍了汉语自然语言处理的相关技术，还有一些源码的解读；...

NLP:HanLP的下载与使用

kuyecsl的博客

03-08

1127

昨天说到要做一个自定义的训练模型，但是很快这个想法就被扑灭了，因为这个手工标记的成本太大，而且我的上级并不是想要我做这个场景，而是希望我通过这个场景展示出可以接下最终需求的能力。换句话来说：可以，但是没必要。,coarse为粗分,fine为细分。

HanLP 预训练模型

01-02

#### 在线加载预训练模型对于在线环境中直接加载特定的多任务学习(MTL)预训练模型，下面的例子展示了如何加载一个多任务处理的小型Electra中文模型： ```python import hanlp mtl_model = hanlp.load(hanlp....

Hanlp训练模型代码

02-16

# 加载预训练的词向量，用于提取句子中的词特征 word2vec = CONLL03_ENGLISH_GLOVE_6B_100D ``` 接下来，定义模型的结构和训练参数： ```python from hanlp.components.ner import ...

【深度学习】利用Java DL4J训练中文版的Word2Vec模型

在技术的广袤天地里，本博客如精准罗盘。剖析前沿科技，深掘代码奥秘，以精炼笔触，带您穿越复杂技术迷宫，速达知识彼岸。

11-25

4764

Word2Vec 是一种基于神经网络的词向量模型，它主要有两种架构：CBOW（Continuous Bag-of-Words）和 Skip-gram。语义空间映射Word2Vec的一个关键作用是将单词映射到低维语义空间中的向量。在这个语义空间里，单词的语义关系通过向量之间的距离和方向来体现。例如，“国王”和“王后”这两个词在语义上有紧密的关联，它们在Word2Vec生成的向量空间中的距离会比“国王”和“汽车”更近。这种向量表示能够让计算机以一种数学上可计算的方式来理解单词之间的语义相似性。

.hanlp.zip

06-03

pyhanlp模型文件.hanlp，参考https://blog.csdn.net/weixin_38705903/article/details/106521519

HanLp数据字典（1.3.3）

09-09

汉语言处理包中的data.zip数据，github上下载速度有点慢，这里提供下载。其他相关资源可从官网上下载jar包及配置文件。

HanLP实现文本分词、提取关键词、聚类（工具资源+实例）

05-12

HanLP是由一系列模型与算法组成的工具包，目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点；提供词法分析（中文分词、词性标注、命名实体识别）、句法分析、文本分类和情感分析等功能。

HanLP自然语言处理

03-14

HanLP是由一系列模型与算法组成的Java工具包，目标是普及自然语言处理在生产环境中的应用。 HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点

hanlp在Python环境中的安装

07-11

HanLP是由一系列模型与算法组成的java工具包，目标是普及自然语言处理再生产环境中的应用。

加载预训练模型的两种方式

weixin_42887772的博客

05-14

2451

通过huggingface快速加载 import transformers from transformers import BertTokenizer,BertModel tokenizer = BertTokenizer.from_pretrained('bert-base-chinese') #只需要huggingface上对应的模型名称 model = BertModel.from_pretrained('bert-base-chinese') 优点：无脑操作缺点：每次都需要在网站下载模型参数

探索中文NLP的宝库：常用预训练模型与词向量下载地址收藏

gitblog_06587的博客

09-20

381

探索中文NLP的宝库：常用预训练模型与词向量下载地址收藏常用的中文预训练模型预训练词向量下载地址收藏项目地址: https://gitcode.com/Resource-Bundle-Collection/048ae ...

HanLP Demo(学习笔记)

山河已无恙

03-27

7438

我曾经害怕别人嘲笑的目光，后来，发现他们的目光不会在我身上停留太久，人们更愿意把目光放在自己身上。知乎上看到，讲给自己。