Python入门NLP（一）

最新推荐文章于 2024-06-06 18:39:59 发布

敲代码的灰太狼

最新推荐文章于 2024-06-06 18:39:59 发布

阅读量843

点赞数

原文链接：http://python.jobbole.com/88874/

版权

NLP（Natural Language Processing），自然语言处理，今天我们主要来研究一下如何用Python去完成简单的自然语言处理。

NPL可以用来做什么呢？

他能做的事情非常多，例如翻译，垃圾邮件过滤，搜索引擎等等。

今天我们用到的模块有：

NLTK 专门做自然语言处理

bs4 BeautifulSoup ，爬虫的一个框架

html5lib BeautifulSoup解析时用的

matplotlib 数据可视化（使词频统计更加形象的展示）

我们通过简单的pip安装语句就可以完成以上四个模块的安装了：

pip install nltk

pip install bs4

pip install html5lib

pip install matplotlib

以上模块完成安装之后我们需要完善一下nltk的库

在cmd指令窗输入Python（运行Python）：

import nltk

nltk.download()

640?wx_fmt=png

弹出一个界面，把里面的所有模块都安装了（点击all即可），如下图：

640?wx_fmt=png

之后我们用request去爬某个网页，再使用bs4清洗一下文字，最后再用split()处理一下：

640?wx_fmt=png

输出结果：

640?wx_fmt=png

我们现在通过nltk中的FreqDist()方法来统计词频：

640?wx_fmt=png

输出：（输出结果太多，这里截取部分结果）

640?wx_fmt=png

感觉太乱了，我们可以画图看看：

freq.plot(20,cumulative=False)

打印结果：

640?wx_fmt=png

可以看出来Python出现的词频是最高的。

但是从上面的结果我们能看出一些无用的词汇，这时候就需要处理停用词了

640?wx_fmt=png

清除无效的单词：

640?wx_fmt=png

这样的效果会比刚刚好一点。

这一期我们就到这里吧

下期见。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

敲代码的灰太狼

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【Python 自然语言处理（NLP）】零基础也能轻松掌握的学习路线与参考资料

weixin_50409347的博客

06-02

864

了解基本的机器学习算法和常用的机器学习库是 Python 自然语言处理的必要条件。在机器学习领域，掌握一些基本的概念如监督学习、无监督学习、半监督学习、回归分析、分类和聚类算法等。另外，需要学习和使用常用的机器学习库，如Scikit-learn，TensorFlow，PyTorch，Keras等。深度学习的应用已经渗透到了 NLP 的各个方面。同时，需要学习和使用深度学习库，如TensorFlow，PyTorch，Keras等。因为 NLP 涉及到文本处理、语言模型、统计学习、机器学习以及深度学习等方面。

python nlp

u011588619的博客

04-03

430

natural language process(NLP)自然语言理解通过 pip install nltk进行安装输入import nltk nltk.downdowan()因为文件不大，可以全部安装现在开始抓取web页面我们引入urllib包，我使用的是python3.6，和版本2 在引入时有所区别。代码如下urllib urllib的request模块可以非常方便地抓取URL内容，...

参与评论您还未登录，请先登录后发表或查看评论

【python】教你彻底了解Python中的自然语言处理（NLP）

最新发布

Easonmax的博客

06-06

1734

。

Python进行NLP分析基础示例

09-03

Python进行NLP分析基础示例包含基本的分词和词频统计

Python自然语言处理入门

culi3118的博客

09-02

513

A significant portion of the data that is generated today is unstructured. Unstructured data includes social media comments, browsing history and customer feedback. Have you found yourself in a situat...

python自然语言处理（NLP）入门.pdf

04-28

Python自然语言处理（NLP）是人工智能领域的一个关键分支，主要目标是使计算机能够理解和处理人类的自然语言。在Python中，NLP的实现离不开强大的工具包，其中最常用的就是Natural Language Toolkit（NLTK）。NLTK是...

python中文自然语言处理基础与实战

02-02

《Python中文自然语言处理基础与实战》是一本深入浅出的教程，涵盖了使用Python进行NLP工作的各个方面。在本文中，我们将详细探讨该领域的重要概念、工具和技术，并结合实际案例来深化理解。首先，让我们从Python...

python - 自然语言处理从入门到实战（1-13 全部代码）.rar

03-22

python - 自然语言处理从入门到实战（1-13 全部代码，可同书籍一起食用。 python - 自然语言处理从入门到实战（1-13 全部代码，可同书籍一起食用。 python - 自然语言处理从入门到实战（1-13 全部代码，可同书籍一起...

python自然语言处理实战pdf_dode.zip

01-05

《Python自然语言处理实战》是一本深入探讨Python在NLP（自然语言处理）领域的实践应用的书籍。PDF版本为读者提供了方便的电子阅读体验，同时附带的代码资源则可以帮助读者更好地理解和应用书中的理论知识。这个...

Python中文自然语言处理基础与实战_源代码和实验数据.rar

07-03

Python中文自然语言处理（NLP）是近年来在大数据和人工智能领域中备受关注的一个重要分支，尤其对于中文文本的理解和分析，Python提供了丰富的库和工具，使得开发者能够高效地进行文本预处理、情感分析、词性标注、...

Python-NLP之旅包含NLP文章代码集锦

08-10

NLP之旅(包含NLP文章/代码集锦)

产品评论大数据挖掘情感分析python版

03-29

产品评论大数据挖掘情感分析python版，带有python代码和数据。

Python自然语言处理（入门讲解）

zy1992As的博客

03-07

794

Python是一种强大而受欢迎的编程语言，易于学习和使用，加上它具有直观的语法和大量的开源文档和社区支持，特别适合用于自然语言处理任务。　　以下是几个Python自然语言处理的实例：　　1.文本清理和预处理　　对于大多数自然语言处理应用程序，首先需要对原始文本进行清理和预处理。Python中有许多用于文本清理和预处理的库和技术，例如nltk(自然语言工具包)和正则表达式。下面是一个简单的文本清理示例，该示例将删除HTML标记和停用词：　　2.分词　　分词是将句子分成单词或标记的过程。Python中有几

PythonNPL练习题

u013373155的博客

04-15

358

处理布朗语料库的新闻和言情文体，找出一周中最有新闻价值并且是最浪漫的日子。定义一个变量days 包含星期的链表，如['Monday', ...]。然后使用cfd.tabulate(samples=days)为这些词的计数制表。接下来用绘图替代制表尝试同样的事情。你可以在额外的参数conditions=['Monday', ...]的帮助下控制星期输出的顺序。P58 from nltk.corpus import brown cfd=nltk.ConditionalFreqDist( (genre,.

第二节机器学习--NPL基础

Successful_clown的博客

08-05

2220

一、NPL 1、NPL：Natural Language Processing 自然语言处理。 2、文本相似度分析：从海量数据（文章，评论）中，把相似的数据挑选出来步骤：把评论翻译成机器看的懂的语言使用机器看的懂得算法轮询去比较每一条和所有评论的相似程度把相似的评论挑出来 2.1、把评论翻译成机器看的懂的语言分词制作词袋模型用词袋模型制作语料库把评论变成词向量 2.2、使用...

life is short ,I need python. NPL jieba 分词基础(上)

quyuquan2014的博客

01-18

366

jieba 分词中文分词的工具有很多种，例如HanLP、jieba分词、FudanNLP、LTP、THULAC、NLPIR等，这些都是开源的分词工具，大多支持Java、C++、Python，本文对基于python的jieba分词的使用作出具体介绍。三种模式 jieba分词支持三种分词模式：精确模式，试图将句子最精确地切开，适合文本分析；全模式，把句子中所有的可以成词的词语都扫描出来, 速度...

昨天520表白失败，我想用Python分析一下...

实验楼

05-21

380

昨天跟喜欢的妹子表白了。失败了。下面是表白的聊天记录：（跟妹子已经认识一段时间）我：灭嘤嘤，我喜欢你。妹子：你干嘛？我：今天520，跟你表白鸭。妹子：那....有多喜欢？...

Python NLP 自然语言处理

简简单单Onlinezuozuo

08-10

1136

代码】Python NLP 自然语言处理。

Python NLP

ysugarr

11-03

384

. ：代替任何单个字符 ^a ：匹配所有以字母a开头的字符串 a& ：匹配所有以字母a结尾的字符串 r"\\" ：匹配反斜杠 [0-9]：任选一个 [0-9]{3}：[0-9]重复三次 #return true or false re.search(regex, string); #return [] exist in string; re.selectall(regex, s...

Python入门：详解自然语言处理实战教程

"《自然语言处理与Python》是一本专为初学者设计的教程，它深入浅出地介绍了如何利用Python这一强大的编程语言来进行自然语言处理（NLP）。本书由Steven Bird、Ewan Klein和Edward Loper合著，版权归属于2009年，...