Stanford CoreNLP 提取句子名词

最新推荐文章于 2024-08-16 07:37:46 发布

黄鑫huangxin

最新推荐文章于 2024-08-16 07:37:46 发布

阅读量4.1k

点赞数 1

分类专栏： python学习深度学习

本文链接：https://blog.csdn.net/qq_33373858/article/details/83793573

版权

深度学习同时被 2 个专栏收录

27 篇文章 0 订阅

订阅专栏

python学习

20 篇文章 0 订阅

订阅专栏

一、环境配置

Stanford CoreNLP 工具包的使用

我的另一篇博客：https://zhuanlan.zhihu.com/p/44180488

二、实例

1.导入已经下载的工具包

from stanfordcorenlp import StanfordCoreNLP
import nltk
from nltk.tree import Tree as nltkTree

nlp = StanfordCoreNLP('./StanfordNLP工具包/stanford-corenlp-full-2018-02-27')

2.句子的词性标注

sentence = 'person removes plate out of cabinet' #输入句子

sen_tag = nlp.pos_tag(sentence)  #词性标注
print(sen_tag)

结果：

NN 为名词，保留标注为‘NN’ 的单词到列表中。

noun_word = []
for i in range(len(sen_tag)):
    if sen_tag[i][1] == 'NN':
        noun_word.append(sen_tag[i][0])
print(noun_word)

结果：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

黄鑫huangxin

关注关注

1
点赞
踩
15

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【java】使用Stanford CoreNLP处理英文（词性标注/词形还原/解析等）

竹聿Simon的专栏

04-22

1万+

本文旨在学习使用Stanford CoreNLP进行自然语言处理。编程环境：64位win7系统，NetBeans，java要求1.8+ CoreNLP版本：3.6.0，下载地址：http://stanfordnlp.github.io/CoreNLP/，获取stanford-corenlp-full-2015-12-09.zip压缩包。 Stanford CoreNLP功能

自然语言处理之命名实体识别-tanfordcorenlp-NER(一)

IT届的小学生

12-18

4356

CoreNLP 项目是Stanford开发的一套开源的NLP系统。包括tokenize, pos , parse 等功能，与SpaCy类似。SpaCy号称是目前最快的NLP系统，并且提供现成的python接口，但不足之处就是目前还不支持中文处理， CoreNLP则包含了中文模型，可以直接用于处理中文，但CoreNLP使用Java开发，python调用稍微麻烦一点。 Stanford CoreN...

2 条评论您还未登录，请先登录后发表或查看评论

探索自然语言处理的宝藏：Stanford.NLP for .NET新时代

最新发布

gitblog_00847的博客

08-16

612

探索自然语言处理的宝藏：Stanford.NLP for .NET新时代 Stanford.NLP.NETStanford NLP for .NET项目地址:https://gitcode.com/gh_mirrors/st/Stanford.NLP.NET 在当今这个信息爆炸的时代，理解并解析人类语言的能力变得尤为重要。斯坦福大学的Stanford NLP套件一直是自然语言处理（NLP）领域的...

使用Standford coreNLP进行中文命名实体识别(NER)

liinux-Talk is cheap,show me the code.

01-16

3598

Stanford CoreNLP是一个比较厉害的自然语言处理工具，很多模型都是基于深度学习方法训练得到的。先附上其官网链接： https://stanfordnlp.github.io/CoreNLP/index.html https://nlp.stanford.edu/nlp/javadoc/javanlp/ https://github.com/stanfordnlp/CoreNL...

C#下调用Stanford CoreNLP

10-15

C#下调用Stanford CoreNLP,实现中文分词,命名实体识别,词性判断.附件中只包含如何调用,需自行从stanford官网下载模型和语料

【实例】python 使用 Stanford-corenlp 分词

神创的博客

02-28

2439

>>> from stanfordcorenlp import StanfordCoreNLP #第一步>>>>>> nlp = StanfordCoreNLP(r'E:/cornlp/stanford-corenlp-full-2018-1-31/',lang='zh')>>> nlp = StanfordCoreNLP(r...

StanfordCoreNLP: 英文句子词性还原、词干标注工具包简单使用（Java）

小太阳~

04-17

6828

一、说明 StanfordCoreNLP是Stanford开发的关于自然语言处理的工具包，其包括分词、词性还原以及词性标注等很多功能。具体可参考官网：https://stanfordnlp.github.io/CoreNLP/。这里主要是将其词性还原功能的简单使用。二、下载和使用 1、下载地址：https://stanfordnlp.github.io/CoreNLP/，下载界面如下图：...

NLP名词解释（持续更新）

DragonBark的博客

09-27

2092

token 即句子中独立的单词，也称标记（token），包括标点在数据中保存为某单词在词典中的位置，类型为 tokenization 标记化（tokenization）把句子分解成独立的token的过程。假设有两句话： s1：My name is Anny. s2：I am a student. 那么把这两句话放在一起，经过token以后（假设参照某一个dictionary），可...

stanford-corenlp.jar.zip_Stanford corenlp_jar_zip

09-20

这个"stanford-corenlp.jar.zip"文件则是Stanford CoreNLP库的Java版本，被封装在一个zip压缩包中，便于下载和使用。首先，我们来详细了解下Stanford CoreNLP的核心组件和功能： 1. **分词（Tokenization）**：这...

stanford-corenlp-4.5.6.zip

03-12

2. 词性标注（Part-of-Speech Tagging）：通过分析上下文，CoreNLP可以确定每个词汇的语法角色，如名词、动词、形容词等，这有助于理解句子结构。 3. 命名实体识别（Named Entity Recognition, NER）：识别文本中...

stanford-corenlp-4.2.2.zip

08-18

Stanford CoreNLP 4.2.2版本中，其NER模块经过精心训练和优化，能够准确地在文本中定位和分类这些实体，这对于信息提取、问答系统、情感分析等应用至关重要。开发者可以通过调用库中的API，轻松地将这项功能集成到...

stanford-corenlp-full-2014-08-27

08-27

"Stanford CoreNLP"是斯坦福大学自然语言处理（NLP）研究团队开发的一套强大的工具集，广泛应用于文本分析、信息提取、情感分析等多个领域。这个名为"stanford-corenlp-full-2014-08-27"的压缩包包含了2014年8月27日...

java opennlp_在java中使用opennlp提取名词短语

weixin_39914732的博客

02-13

309

我试图从句子中提取名词短语.我正在使用opennlp librari“en-parser-chunking.bin”.代码示例：ArrayList nounPhrases = new ArrayList<>();searchmethod("what is the nickname of the British flag?");for(int t =0; t<50; t++){st...

NLP专业术语

yiqingyang2012的专栏

11-10

1988

hyper-parameters：在训练模型时，有些参数是需要手动设置的，每个参数有一个可选的范围或者列表可供训练，可以调用sklearn的GridSearchCV函数来自动统计搜索。http://blog.csdn.net/u010454729/article/details/50754460development set：在paper中也简写成dev。一般在训练模型时需要用到交叉验证，这部分用来

NLP一些常见的专有名词

薰珞婷紫小亭子的博客

07-30

1133

NLP一些常见的专有名词词性是词语在句子中扮演的语法角色，也被称为词类（Part-Of-Speech,POS）词性标注（POS Taging)任务是给定一个句子，输出句子中每个词相应的词性。句法分析（Syntatic Parsing）的主要目标是给定一个句子，分子句子的句法成分信息，例如主谓宾定状补等成分。最终的目标是将词序列表示的句子转换成树状结构，从而有助于更准确地理解句子的含义，并辅助下游自然语言处理任务。词义消歧（Word Sense Disambiguation,WSD）,一词多义（如，

stanfordCoreNLP安装和使用

chanyeolchichi的博客

10-08

946

stanfordCoreNLP安装过程注：这是使用java ee项目所做的引入首先需要配置java(版本>=jdk1.8)，配置环境等等（不多赘述，很多教程的等有时间我会补上哒）如何查看自己的Java:搜索输入cmd再输入java 查看java版本 CoreNLP下载下载地址 CoreNLP 点击如图下载语言模型，选择自己需要的就行了将语言包拖入解压的corenlp根目录我是改过文件名的哈将corenlp引入idea 新建Java ee项目点击左上角的f.

【Chinese Coreference resolution】StanfordNLP代码实现

Vincy_King

04-26

1235

最近在做一个角色识别的项目，项目中需要用到共指消解的方法，大体了解的有四种：基于Spenbert（https://github.com/troublemaker-r/Chinese_Coreference_Resolution/blob/2b88450eeb3da248fb0f6365c38a32b9fffcb962/README.md）基于问答系统的Span prediction（https://github.com/ShannonAI/CorefQA）参考Emory NLP的工作，他们也是做角色

python分块处理功能_Python自然语言处理学习笔记之信息提取步骤&分块（chunking）...

weixin_39670545的博客

11-20

573

一、信息提取模型信息提取的步骤共分为五步，原始数据为未经处理的字符串，第一步：分句，用nltk.sent_tokenize(text)实现,得到一个list of strings第二步：分词，[nltk.word_tokenize(sent) for sent in sentences]实现，得到list of lists of strings第三步：标记词性，[nltk.pos_tag(sent...

Stanford CoreNLP 进行中文语义解析java

07-23

Stanford CoreNLP是一个强大的自然语言处理工具包，由斯坦福大学开发，它包含了一系列用于中文文本分析的模块，包括分词、命名实体识别、依存句法分析等。在Java中使用CoreNLP进行中文语义解析，你可以按照以下步骤操作： 1. **下载和配置**：首先从官方GitHub仓库（https://github.com/stanfordnlp/CoreNLP）下载最新版本的CoreNLP，并根据需要配置Java环境。 2. **添加依赖**：将CoreNLP库加入到你的项目中，通常会通过Maven或Gradle的dependency管理添加。 3. **初始化模型**：创建`Properties`对象来加载配置文件，设置所需的处理器（如`ChineseSegmenter`、`ChineseAnalyzer`等），然后实例化`StanfordCoreNLP`对象。 4. **处理文本**：对输入的中文文本进行预处理，比如拆分成词语（`tokenize()`），然后使用`StanfordCoreNLP`进行分析，获取词汇、词性标注、依存关系等信息。 ```java Properties props = new Properties(); props.setProperty("annotators", "tokenize,ssplit,pos,lemma,depparse"); StanfordCoreNLP pipeline = new StanfordCoreNLP(props); Annotation annotation = new Annotation(text); pipeline.annotate(annotation); List<CoreMap> sentences = annotation.get(CoreAnnotations.SentencesAnnotation.class); for (CoreMap sentence : sentences) { // 获取各个成分的信息 } ``` 5. **结果解读**：遍历`CoreMap`中的元素，可以提取出名词短语、动宾结构等关键信息，进一步进行语义分析。