2020.12-HanLP使用记录（持续更新：分词，NER等）

最新推荐文章于 2024-08-05 20:54:05 发布

CuriousLiu

最新推荐文章于 2024-08-05 20:54:05 发布

阅读量1.3k

点赞数

分类专栏：个人笔记文章标签： HanLP 分词 NER

本文链接：https://blog.csdn.net/curiousliu/article/details/111152386

版权

个人笔记专栏收录该内容

15 篇文章 1 订阅

订阅专栏

2020.12-HanLP使用记录（持续更新：分词，NER等）

背景

HanLP-中文NER

HanLP-中文分词

背景

在中文文本预处理场景中，现有多款工具，例如jieba等。但是通过个人的使用感官尝试，发现HanLP库的分词效果，NER命名实体识别提取效果准确度都更高些，汇总一些HanLP工具的使用方法。

HanLP-中文NER

import hanlp

recognizer = hanlp.load(hanlp.pretrained.ner.MSRA_NER_BERT_BASE_ZH) # 中文NER
recognizer([list(splitText)]) # 输入可能要以list形式输入

HanLP-中文分词

import hanlp

tokenizer = hanlp.load('CTB6_CONVSEG') # 加载模型，需要一段时间
tokenizer("待分词的文本待分词的文本待分词的文本待分词的文本")

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

CuriousLiu

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hanlp1.8.3jar包下载

06-29

hanlp，hankcs，支持中文分词（N-最短路分词、CRF分词、索引分词、用户自定义词调、词性标注），命名实体识别（中国人民、音译人民、日本人民，地名，实体机构名识别），关键词提取，自动摘要，短语提取，拼音转换，...

HanLP-命名实体识别总结

07-31

1809

人名识别在HanLP中，基于角色标注识别了中国人名。首先系统利用隐马尔可夫模型标注每个词语的角色，之后利用最大模式匹配法对角色序列进行匹配，匹配上模式的即为人名。理论指导文章为：《基于角色标注的中国人名自动识别研究》，大家可以百度一下看看地名识别理论指导文章为：《基于层叠隐马尔可夫模型的中文命名实体识别》机构名识别机构名的理论指导文章为：《基于角色标注的中文机构名识别》命名实体识别De...

参与评论您还未登录，请先登录后发表或查看评论

【NLP】Python调用Hanlp进行NER处理

EchoooZhang的博客

10-21

2767

【NLP】Python调用Hanlp进行NER处理HanlpHanlp是什么一些坑。。。测试一下吧！具体NER也在继续，等下一篇吧~ Hanlp 最近在想小论文Idea,其中有一部分想用命名实体抽取（NER），以前NLP有一定基础，这次想用新的可用的工具，以前用过斯坦福的NLP，但是据说中文效果更好的应该是Hanlp。Hanlp是Java支持的，本以为可以直接用Pyhanlp,but…(- -）一...

HanLP和BERT-BiLSTM-CRF在命名实体识别上的区别

最新发布

JLY19970726的博客

08-05

648

HanLP和BERT-BiLSTM-CRF在命名实体识别（Named Entity Recognition, NER）方面的主要区别体现在模型架构、特征提取能力、训练方式以及应用场景的适应性上。

HanLP实战教程：离线本地版分词与命名实体识别

我的一些代码。。。

04-06

4329

在这篇博客文章中，我们将介绍如何使用HanLP 2.1.0-beta.46版本的native API在本地离线环境下进行中文分词和命名实体识别。我们将重点介绍单任务API的使用方法，以及如何加载预训练模型。

python3使用hanlp识别人名

xutengfei999的博客

10-29

1034

1.安装hanlp pip install hanlp 2.使用 import hanlp #识别实体 recognizer = hanlp.load(hanlp.pretrained.ner.MSRA_NER_BERT_BASE_ZH) #解析人名 def extract_name(text:str): if not text: return "" result = parse_name_hanlp(text) ...

技术改变生活——用HanLP来协助处理现实中问题

dianyanxia的博客

11-13

1392

此例是我之前在学习nlp过程中的一个例子，需求如下：平时收集了一下客户对于餐馆的评价，目标是将这些评价数据进行分类，比如分成满意或者不满意，这一类简单的客户评价情感极性分析，来策划餐馆满意菜品的推荐、用倾向性分析来改善餐馆的服务质量，以及提高创收利润。 1 .首先来查看一下收集到的评价数据。评价数据的抽样：可以看到数据集中有餐馆的id编号，以及对餐馆的评价分数(总体评分、环境、口味、服务) 2. 数据清洗：在语料库中找到我们感兴趣的东西，把不感兴趣...

30行代码利用HanLP识别姓名

颹蕭蕭

09-26

251

hanlp flask 姓名

bert-chinese-ner：使用预训练语言模型BERT做中文NER

02-06

使用预训练语言模型BERT做中文NER尝试，微调BERT模型 PS：移步最新模型代码参考使用方法从下载bert源代码，存放在路径下bert文件夹中从下载模型，放置在checkpoint文件夹下使用BIO数据标注模式，使用人民日报...

albert-chinese-ner：使用预训练语言模型ALBERT做中文NER

02-06

下载albert中文模型，这里使用的是base 将模型文件夹重命名为albert_base_zh，加入项目中运行python albert_ner.py --task_name ner --do_train true --do_eval true --data_dir data --vocab_file ./albert_config...

NER-in-Chinese-Text:NLP硬BiLSTM + CRF

05-15

NER：Keras中的中文命名实体识别模型1：基于字符嵌入的BiLSTM-CRF。 Model2：在model1的基础上。使用Conv1D从单词嵌入中提取n_gram特征作为辅助特征。 ps：首先运行preprocess.py和utils.py，以获取已处理的train ...

spacy-ner-annotator:使用自定义数据集训练 Spacy ner

05-29

spacy-ner-注释器安装pip3 安装 spacy使用步骤打开index.html文件并打开其中的数据。发布注释下载数据并使用convert_spacy_train_data.py转换为 spacy 格式如果您愿意，将数据拆分为训练和测试并将其添加到train.py...

关于hanlp2.0的问题

qq_38148600的博客

11-18

675

当hanlp安装成功的时候 importhanlp报错是在该文件出现的问题这个文件是从网上下载bert模型，假如我不使用hanlp的bert是否将其删除会好一点。

hanlp 训练模型_hanlp学习三：自定义命名体识别

weixin_39783771的博客

12-20

923

from pyhanlp import *importosfrom pyhanlp.static importdownload, remove_file, HANLP_DATA_PATHimportzipfileNERTrainer= JClass('com.hankcs.hanlp.model.perceptron.NERTrainer')AbstractLexicalAnalyzer= JCl...

java实现NER模型识别问题中的实体

04-28

1223

3.训练ner模型：可以从头开始制作ner模型，但是stanford corenlp提供了预先训练好的模型，您可以直接使用它们。4.运行模型：使用corenlp服务器上的rest api或调用corenlp提供的java函数运行模型，并将结果输出到新文件或同一文件的新列中。3.易于使用的api：hannlp的java api非常易于使用，开发者可以轻松地将其集成到自己的java应用程序中。1.高质量的中文自然语言处理：hannlp在中文自然语言处理方面表现出色，可以有效地解决复杂的自然语言处理问题。

jieba分词、关键词提取使用；hanlp 分词、词性、ner使用

weixin_42357472的博客

01-10

748

load_userdictkey自己添加关键词文件 cut_all=False或Truek表示精准或者默认 analyse.extract_tags 分析词频 import jieba import jieba.analyse # jieba.load_userdict(r&quot;C:\Users\Lavector\Desktop\jieba.txt&quot;) # res = jieba.cut(&quot;#遇见美...

Python 命名实体识别(NER) 库使用指南