NLTK库函数用法

最新推荐文章于 2024-08-03 20:56:21 发布

冥更

最新推荐文章于 2024-08-03 20:56:21 发布

阅读量1.4k

点赞数

分类专栏： Python 文章标签： nltk

本文链接：https://blog.csdn.net/qq_24852439/article/details/84974004

版权

Python 专栏收录该内容

13 篇文章 1 订阅

订阅专栏

nltk.sent_tokenize()

    for r in reader:
        print(r[0])
        print(nltk.sent_tokenize(r[0].lower()))
        print('\n')

输出：

They wont nerf it. I just hope people decide to run fun decks once TGT hits and stop being assholes.
['they wont nerf it.', 'i just hope people decide to run fun decks once tgt hits and stop being assholes.']

Seemed to start by a lot of falling over each other.
['seemed to start by a lot of falling over each other.']

That whole show was powerful. Landed a spot in my top 5
['that whole show was powerful.', 'landed a spot in my top 5']

nltk.sent_tokenize()是按符号对评论进行分隔

nltk.word_tokenize()

    for r in reader:
        print(r[0])
        print(nltk.word_tokenize(r[0].lower()))
        print('\n')

输出

Well, about that Ninth Circle...
['well', ',', 'about', 'that', 'ninth', 'circle', '...']

Goddamn you're retarded.
['goddamn', 'you', "'re", 'retarded', '.']

I'm in Tampa, you piece of shit. Come visit me.
['i', "'m", 'in', 'tampa', ',', 'you', 'piece', 'of', 'shit', '.', 'come', 'visit', 'me', '.']

按照 word分割

nltk.FreqDist()

word_freq = nltk.FreqDist(itertools.chain(*sent_words))
for w in word_freq:
    print(w, word_freq[w])

输出：

degrasse 1
hanks 1
marajuana 1
anti-vaxxers 1
felicidades 1
loader 1

输出列表中重复项的次数

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

冥更

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python在自然语言处理领域的应用 Natural Language Processing With Python: Analyzing Text

程序员光剑

08-05

867

在自然语言处理领域，Python被视作最优秀、应用范围最广泛、社区氛围最活跃、学习曲线最平缓的一门编程语言。它提供丰富的库函数和框架支持，有着庞大的生态系统，包括机器学习库scikit-learn、NLP工具包nltk等，使得数据分析者和科研工作者能够快速构建项目并实现模型训练、部署和应用。本文作者对Python在自然语言处理领域的应用进行了深入阐述，旨在帮助读者快速了解Python及其相关工具包的使用方法和技巧，帮助非计算机专业人员理解文本数据的处理过程。

NLTK——常用函数

weixin_30291791的博客

04-26

579

1.Functions Defined for NLTK's Frequency Distributions ExampleDescription fdist = FreqDist(samples) create a frequency distribution containing the given samples fdist[sample] += 1...

参与评论您还未登录，请先登录后发表或查看评论

NLTK部分函数

weeznn的博客

09-18

1235

刚开始接触自然语言处理，记下一些NLTK函数：第一步：哈啊哈>>> from nltk.book import * *** Introductory Examples for the NLTK Book *** Loading text1, ..., text9 and sent1, ..., sent9 Type the name of the text or sentence to view i

Python与自然语言处理库NLTK

最新发布

master_chenchen的博客

08-03

786

最后，Python有一个专门为自然语言处理设计的强大库——NLTK（Natural Language Toolkit），它就像一个瑞士军刀，包含了各种实用工具和算法，能够满足从基础到高级的各种需求。在数字时代的今天，数据就像是流淌在互联网中的血液，而其中最鲜活的一部分莫过于人类的语言。你可以把这里当作自己的家，无论是工作之余的小憩，还是寻找灵感的驿站，我都希望你能在这里找到属于你的那份快乐和满足。

NLTK中常见定义的函数

Teng49的博客

08-03

1197

一、NLTK频率分布类中定义的函数例子描述 fdist = FreqDist（sample）创建包含给定样本的频率分布 fdist.inc(sample) 增加样本 fdist['monstrous']

NLTK基础函数

weixin_37773766的博客

12-14

381

#from nltk.book import *; #导入NTLK包中book中的所有的例子模型 #print(text1); #输出book中text1的相关信息 #text1.concordance("monstrous"); #在text1中找到特定单词并显示出上下文 #print("monstrous in text1 similar to"); #text1.simi...

Python: NLTK几个入门函数

weixin_34007291的博客

10-01

1.统计词频的concordance() 函数格式：text.concordance(“the text word”) 例如：text.concordance(word) text1.concordance("monstrous")Displaying 11 of 11 matches:ong the former , one was of a most monstrous size ...

NLTK的使用

Strangemmm的博客

01-26

651

from nltk.book import * #使用nlp工具包 text1.concordance(“monstrous”) #搜索文本，看到词的上下文 text1.similar(“monstrous”)#搜索词的上下文，查找还有哪些词出现在相似的上下文中，以此判断该词在文中的意思函数common_contexts允许我们研究两个或两个以上的词共同的上下文，如monstrous和very。我们必须用方括号和圆括号把这些词括起来，中间用逗号分割。 text2.common_contexts([“

python nltk库_Python之NLTK

weixin_39876450的博客

12-16

268

继续了解NLTK《用Python玩转数据》byDazhuang@NJUNLTK包括获取语料库、字符串处理、搭配发现、词性标注、机器学习、分块解析、语义解释、指标评测、概率与估计等多项语言任务，在处理时非常方便，例如要载入并去掉停用词可用类似如下几行简单代码就可以完成：fromnltk.corpusimportstopwordsstopwords=stopwords.words('eng...

基于 nltk 模块中的朴素贝叶斯模型的文本分类任务

总有人要摆烂的，为什么不能是我呢

04-23

929

基于 nltk 模块中的朴素贝叶斯模型的文本分类任务前言一、安装并导入工具包二、统计词频：我们对整个语料库统计词频形成词表，并选取每个类别70%的文件作为训练集，30%的文件作为测试集三、去除停用词四、生成用于分类的词表（去除部分高频词）五、获取文本特征六、贝叶斯分类器训练七、准确率计算八、不去除停用词和去除停用词的准确率结果对比和思考九、代码总和前言基于 nltk 模块中的朴素贝叶斯模型的文本分类任务：文本共包含七个类别，每个类别包含200个文本。一、安装并导入工具包安装并导入工具包：.

使用NLTK库进行更强大的文本预处理和特征提取

# 第一章：介绍NLTK库 ## 1.1 NLTK库的概述 NLTK（Natural Language Toolkit）是一个开源的Python库，专门用于处理和分析自然语言文本。它提供了各种功能和工具，可以帮助我们进行文本预处理、特征提取、情感分析...

机器学习--朴素贝叶斯分类函数

qq_32572085的博客

12-06

1745

一、前言朴素贝叶斯算法是有监督的学习算法，解决的是分类问题，如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立（条件特征独立）性和连续变量的正态性假设为前提，就会导致算法精度在某种程度上受影响。本篇文章将从朴素贝叶斯推断原理开始讲起，通过实例进行辅助讲解。最后，使用...

Newspaper库，一个新手也能快速上手的爬虫库

汉阳Hann's Home

03-23

4463

总的来说，Newspaper是一个非常适合初学者和新闻类爬虫需求的Python库。它简单易用，功能丰富，能够帮助用户快速地从新闻网站中提取所需信息。然而，对于更复杂的项目或者网站有强劲的反爬虫功能的话，可能会在处理过程中出现各种bug或者被目标网站直接拒绝访问或者的情况，此时就需要结合其他工具或框架来实现更稳定、更高效的爬取任务。

NLTK简单入门函数小汇总

苗_的博客

04-22

441

说明：本文代码均来自Natural Language Processing with Python 1. concordance(" ") 搜索某个特定词语在文章中出现的位置，并显示上下文 2. similar(" ") 搜索文章中与目标用法、意义相似的词 3. common_contexts([" "," "]) 这个函数和similar有点类似，但是不同的是,这个函数是用来搜索list...

nltk一些函数意思

胜利属于有准备的人

09-12

1420

NLTK入门-常用函数

lllllldxsd的博客

05-01

809

1.text.concordance(word) 这个函数就是用来搜索单词word在text 中出现多的情况,包括出现的那一行,重点强调上下文,实例如下: >>> text1.concordance("monstrous") Displaying 11 of 11 matches: ong the former , one was of a most monstrous size...

python nltk常用函数

xy773545778的博客

02-09

458

截图来自《python自然语言处理》

nltk.sent_tokenize() nltk.word_tokenize()利用分句子，分词，