【自然语言处理】 | NLTK初识

最新推荐文章于 2024-08-03 20:56:21 发布

mico_cmm

最新推荐文章于 2024-08-03 20:56:21 发布

阅读量244

点赞数

分类专栏： NLP自然语言处理文章标签： NLP

本文链接：https://blog.csdn.net/mico_cmm/article/details/87967166

版权

NLTK是自然语言处理的重要工具包，需要按需安装其组件。分词使用word_tokenize，过滤停用词通过stopwords模块，词性标注借助pos_tag，还可进行分块和命名实体识别。通过nltk.download()安装所需包，如进行词性标注前需先安装相应工具。

摘要由CSDN通过智能技术生成

NLTK是自然语言处理中常用的工具包

导入：

import nltk

nltk中的工具/模块/包不是事先安装好的，需要用到哪个就安装那个，安装方法：

nltk.download()

就打开了安装界面，在all packages中选择需要的包安装即可。

分词：

（下面以英文文本处理为例）

from nltk.tokenize import word_tokenize
from nltk.text import Text

input_str="Today's weather is good,very windy and sunny,we have no classes in the afternoon,we have to play basketball tomorrow"

# 需要先在nltk download安装alpino包
# 分词
tokens=word_tokenize(input_str)

将子串变为小写：

tokens=[word.lower() for word in tokens]
tokens[:5] # 输出前5个

创建text对象：

t=Text(tokens)

t.count('good') # 统计某个词出现的次数
t.index('good') # 索引
t.plot(8)
help(Text)

过滤停用词：

加载停用词典：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mico_cmm

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

NLP入门系列—NLTK初识

02-01

3万+

文本已成为最常见的表达形式之一。我们每天都要发送电子邮件、短信、推文、更新状态。因此，非结构化文本数据变得非常普遍，分析大量文本数据现在是了解人们的想法的关键方法。微博上的推文帮助我们找到热门新闻主题。淘宝的评论帮助用户购买评价最高的产品。这些例子都是自然语言处理（NLP）任务的体现。NLP属于计算机科学领域，主要做人机互动。NLP技术用于分析文本，为计算机提供了一种理解人类语言的方法。NLP应用程序的一些例子包括自动文本摘要、主题分隔和情感分析。

【ChatBot开发笔记】聊天机器人准备工作——初识NLTK库、语料与词汇资源

weixin_44524843的博客

03-07

646

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar

参与评论您还未登录，请先登录后发表或查看评论

一、NLTK工具包使用

微信号：RunsenLiu

04-08

2234

Natural Language Toolkit，自然语言处理工具包，在NLP领域中，最常使用的一个Python库。先安装NLTk pip install nltk 注意你现在安装好一个框架而已，里面没有东西的新建一个ipython，输入 import nltk #pip install nltk nltk.download() 所以要下载里面的包，我觉得下book 和popular下好就可...

NLP基础：NLTK使用

Wisimer

04-26

1535

NLTK NLTK在NLP上的应用情感分析文本相似度文本分类一、安装NLTK sudo pip install nltk python3 >>> import nltk >>> nltk.download() 其中 nltk.download() 用来下载nltk自带的一些语料库测试布朗大学的语料库： >>> from nlt...

Python与自然语言处理库NLTK

最新发布

master_chenchen的博客

08-03

806

最后，Python有一个专门为自然语言处理设计的强大库——NLTK（Natural Language Toolkit），它就像一个瑞士军刀，包含了各种实用工具和算法，能够满足从基础到高级的各种需求。在数字时代的今天，数据就像是流淌在互联网中的血液，而其中最鲜活的一部分莫过于人类的语言。你可以把这里当作自己的家，无论是工作之余的小憩，还是寻找灵感的驿站，我都希望你能在这里找到属于你的那份快乐和满足。

NLTK的词性[转]

kker的博客

05-21

1204

原文出处：http://blog.csdn.net/heyongluoyao8/article/details/43731743NOUN n,VERB v ,ADJ a, ADV r, ADJ_SAT s NOUN: [(’s’, ”), (‘ses’, ‘s’), (‘ves’, ‘f’), (‘xes’, ‘x’), (‘zes’, ‘z’), (‘ch

nltk使用方法总结

weixin_43758551的博客

08-28

1640

https://www.52nlp.cn/tag/nltk%E4%BB%8B%E7%BB%8D https://www.52nlp.cn/author/baiboy https://www.cnblogs.com/baiboy/p/nltk1.html https://www.cnblogs.com/chen8023miss/p/11458571.html https://zhuanlan.zhihu.com/p/98808960 https://blog.csdn.net/sunflower_sara/a

自然语言处理库——NLTK

满腹的小不甘

05-09

6647

NLTK（www.nltk.org）是在处理预料库、分类文本、分析语言结构等多项操作中最长遇到的包。其收集的大量公开数据集、模型上提供了全面、易用的接口，涵盖了分词、词性标注(Part-Of-Speech tag, POS-tag)、命名实体识别(Named Entity Recognition, NER)、句法分析(Syntactic Parse)等各项 NLP 领域的功能。 ...

word分词器java源码-A-Smattering-of-NLP-in-Python:Python中自然语言处理编程的非常简要介绍

06-05

回到数据科学的黑暗时代，在自然语言处理 (NLP) 中工作的每个小组或个人通常都维护着各种各样的自制实用程序，旨在处理与 NLP 相关的许多常见任务。尽管每个人都怀有最好的意图，但这些代码的大部分内容都是糟糕的...

Python字符串与自然语言处理：文本分析的强力工具

![Python字符串与自然语言处理：文本分析的强力工具]...本章将带领读者探索Python的字符串基础，了解文本处理的初步知识，为之后深入学习自然语言处理（NLP）打下坚实的基础。 ## 1.1 Pytho

nltk-2.0.3

09-08

自然语言处理包nltk-2.0.3，当前最流行的自然语言处理与开发工具箱，在进行自然语言处理时刻大幅度加快处理的速度。使用PIP 指令即可完成安装。

【深度学习】NLTK入门与实战：文本分析与自然语言处理

qq_33578950的博客

04-14

2765

NLTK是一个强大的Python库，用于处理人类语言数据。它提供了易于使用的接口，以支持多种任务，如分词、词性标注、命名实体识别、情感分析和文本分类等。通过NLTK，我们可以更好地分析和理解自然语言数据，从而为数据科学家、研究人员和开发人员提供有价值的见解。本文简要介绍了NLTK的基本概念和功能，并通过一系列代码实例展示了如何使用NLTK进行文本分析和自然语言处理。希望通过本文，您能够更好地理解和学习NLTK，并在实际应用中取得成功。

NLP常用工具包实战（3）NLTK工具包：英文数据分词、Text对象、停用词、词性标注、命名实体识别、数据清洗实例

haiwang_luo的博客

06-01

1120

NLTK 非常实用的文本处理工具，主要用于英文数据，历史悠久~ import nltk # nltk.download() # nltk.download('punkt') # nltk.download('stopwords') from nltk.tokenize import word_tokenize from nltk.text import Text from nltk.corpus import stopwords from nltk import pos_tag from nltk.chun

NLTK的使用（持续更新）

KPer_Yang的博客

09-09

803

NLTK的使用

【原】Python NLP实战之一：环境准备

iteye_19939的博客

05-07

562

最近正在学习Python，看了几本关于Python入门的书和用Python进行自然语言处理的书，如《Python编程实践》、《Python基础教程》（第2版）、《Python自然语言处理》（影印版）。因为以前是学Java的，有着良好的面向对象的思维方式，所以刚开始看Python的语法，觉得Pyhon太随意了，很别扭，有不正规之嫌。而且，Python自己也正在向面向对象（OO）靠拢。但是，后来看到P...

用NLTK做英文命名实体识别（NER）效果不佳怎么办？

qq_38146797的博客

11-13

921

用NLTK进行词性标注，我们得到一个元组列表，其中包含句子中的单个单词及其相关的词性。使用函数nltk.ne_chunk（），我们可以使用分类器识别命名实体，分类器添加类别标签（如PERSON，ORGANIZATION和GPE）。 NLTK命名实体识别效果如下图：Digital Farm(ORGANIZATION)识别成功词标识符与块级别分割然而，NER任务在中文语料上表现不佳，所以开源工具NLTK也一样。为了能够满足我们的命名实体识别需求，我们可以引入正则表达式。正则表达式.

python自然语言处理工具nltk安装_自然语言处理工具 nltk 安装使用

weixin_39749243的博客

12-17

432

github 地址：https://github.com/nltk/nltk/官方地址：http://www.nltk.org/中文文档：http://download.csdn.net/detail/u013378306/9756747安装及测试Install NLTK: runsudopipinstall-UnltkInstall Numpy (optional): runsudo...